TITANIDE 云原生開發(fā)之旅1 | 使用 Jupyter Notebook 實現(xiàn)數(shù)據(jù)分析
作者:行云創(chuàng)新 John
TITANIDE 云原生開發(fā)之旅正式開啟了。
首先,我會聚焦于面向初學(xué)者,然后由淺入深,分享我是如何使用?TITANIDE?(在線IDE)的云原生開發(fā)旅程。
如果是傳統(tǒng)的開發(fā),對于一個初學(xué)者來說,需要配置開發(fā)環(huán)境,學(xué)習(xí)門檻高。我們本次講解的內(nèi)容是使用 Jupyter 實現(xiàn)數(shù)據(jù)分析,那么您需要安裝 Python 環(huán)境,Jupyter Notebook 及其用到的依賴組件。不過,我們?yōu)榱司劢故褂?Jupyter 實現(xiàn)數(shù)據(jù)分析,直接采用在線的 TITANIDE 來實現(xiàn)。
TITANIDE社區(qū)版免費下載地址>www.cloudtogo.cn
TITANIDE 簡介
TITANIDE(在線IDE)?是采用 B/S 架構(gòu)設(shè)計的云原生集成開發(fā)環(huán)境,內(nèi)置了業(yè)界主流的IDE,讓您能夠更快速的啟動一個您所熟悉的 IDE,不管您以前是使用 VS Code、WebStorm、Intellij IDEA、Goland、Pycharm,總有一款適合您。您無需搭建開發(fā)環(huán)境,只需要打開瀏覽器就能編寫并運行、調(diào)試您的項目代碼,從而聚焦您業(yè)務(wù)。
TITANIDE社區(qū)版免費下載地址>www.cloudtogo.cn
TITANIDE 提供了一系列開箱即用的模板,您可以直接通過模板來來開始您的編程之旅。
本文我們使用了 VS Code for Python 模板。

Jupyter 簡介
盡管不同領(lǐng)域、不同背景,但是,有一些工具已經(jīng)成了數(shù)據(jù)科學(xué)領(lǐng)域的標(biāo)準(zhǔn)化工具,例如,Python、Jupyter Notebook。
Jupyter 項目是一個非盈利,100% 開源的項目,您可以使用 Jupyter 來開發(fā)支持交互的數(shù)據(jù)科學(xué)、科學(xué)軟件和網(wǎng)頁應(yīng)用。JupyterLab,Jupyter Notebook, 以及 Jupyter Hub 是由 Jupyter 項目組開發(fā)的三個關(guān)鍵的開源軟件項目
Jupyter Notebook是基于網(wǎng)頁的用于交互計算的應(yīng)用程序。其可被應(yīng)用于全過程計算:開發(fā)、文檔編寫、運行代碼和展示結(jié)果。它的用途包括:數(shù)據(jù)清理和轉(zhuǎn)換、數(shù)值模擬、統(tǒng)計建模、數(shù)據(jù)可視化、機器學(xué)習(xí)等等。
TITANIDE社區(qū)版免費下載地址>www.cloudtogo.cn
它具有以下優(yōu)勢:
?可選擇語言:支持超過40種編程語言,包括 Python、R、Scala 等。
?分享筆記本:可以使用電子郵件、GitHub 和 Jupyter Notebook Viewer 與他人共享。
?交互式輸出:代碼可以生成豐富的交互式輸出,包括HTML、圖像、視頻、LaTeX 等。
?大數(shù)據(jù)整合:通過 Python、R、Scala 編程語言使用 Apache Spark 等大數(shù)據(jù)框架工具。支持使用 pandas、scikit-learn、ggplot2、TensorFlow 來探索同一份數(shù)據(jù)。

操作步驟
創(chuàng)建新的 Jupyter Notebook
Mac 用戶通過快捷鍵 Command + Shift + P 打開命令操作面板;Windows 用戶通過快捷鍵 Ctrl + Shift + P 打開命令操作面板。創(chuàng)建新的 Jupyter Notebook。

Jupyter 代碼單元格
在這個 Notebook 中,你將體驗操作代碼單元格。
首先,運行以下代碼單元格。就像之前我所提到的,你可以通過選中并點擊運行(run cell)按鈕來運行代碼單元格。另外,你也可以通過快捷鍵 Shift + Enter 來運行。使用快捷鍵的好處是你的雙手不需要離開鍵盤。
單元格中的代碼運行的結(jié)果將會顯現(xiàn)在單元格下方。它和正常的 Python shell 一樣打印出代碼的運行結(jié)果,但是只會打印最后一個運行結(jié)果。如果你想打印所有結(jié)果,你需要使用 print() 。

在 Jupyter 代碼單元格編寫代碼,在這里,我們將輸出一個正玄波。第一次運行會提升模組未安裝的錯誤信息:
import numpy as np
import matplotlib.pyplot as plt
x = np.linspace(0, 20, 100)
plt.plot(x, np.sin(x))
plt.ylabel('sin')
plt.show()

安裝依賴組件
安裝以下兩個模組
# 如果安裝速度慢,請確認(rèn)使用合適的 pip 源
export PIP_EXTRA_INDEX_URL=https://pypi.tuna.tsinghua.edu.cn/simple
# 安裝依賴
pip install matplotlib
pip install pandas

調(diào)試運行
在TITANIDE(在線IDE)?Python 交互式窗口中,可以查看、檢查及過濾當(dāng)前 Jupyter 會話中的變量。通過在運行代碼和單元格后展開變量”
部分,您將看到當(dāng)前變量的列表,這些變量將在代碼中使用變量時自動更新。單擊每個列標(biāo)題將允許您對表中的變量進行排序。
有關(guān)變量的其他信息,還可以雙擊行或使用數(shù)據(jù)查看器中的顯示變量按鈕在數(shù)據(jù)查看器中查看變量的更詳細(xì)視圖。打開后,您可以通過搜索行來過濾值。

總結(jié)
通過本文提到的方法,您可以在 15 分鐘內(nèi)快速的通過?TITANIDE?(在線IDE)提供的開箱即用的 Python 模板,創(chuàng)建 Jupyter Notebook 實現(xiàn)數(shù)據(jù)分析。
--------------------------
TITANIDE社區(qū)版免費下載地址>www.cloudtogo.cn