不超過百行的SQL文件提取器
數(shù)據(jù)是互聯(lián)網(wǎng)的靈魂、沒有數(shù)據(jù)互聯(lián)網(wǎng)就是一個(gè)無用的空殼子,像人工智能、大數(shù)據(jù)、智能算法等。都是需要基礎(chǔ)數(shù)據(jù)來驗(yàn)證模型是否是可用的,來進(jìn)行調(diào)參矯正算法的可用性、幫助算法的落地,對算法起到最關(guān)鍵的作用。所以數(shù)據(jù)的獲取以及對數(shù)據(jù)的處理就是非常重要的。
通常的數(shù)據(jù)格式是txt、sql、excel以及word,其中最重要的還是SQL中的數(shù)據(jù)、SQL數(shù)據(jù)包括MySQL、SQLServer、SQLite、Oracle等,導(dǎo)出的數(shù)據(jù)格式。常用的數(shù)據(jù)處理語言是Python、因?yàn)镻ython是個(gè)膠水語言,沒有Python搞不定的事。Python比較適合做些快速、時(shí)間緊、參與人員較少,切性能要求不高的項(xiàng)目,而且Python成熟的庫很多、這也是它被稱為膠水語言的原因。
技術(shù)要求需要懂得python3的基礎(chǔ)語法以及對正則表達(dá)式有基礎(chǔ)了解。
實(shí)現(xiàn)步驟
讀取SQL文件中的數(shù)據(jù)、去除多余的內(nèi)容并提取需要的數(shù)據(jù)、追加到集合中;
2.將集合中的數(shù)據(jù)轉(zhuǎn)成json格式;
3. 定義轉(zhuǎn)換后的文件地址并寫入文件中
所有代碼:
實(shí)現(xiàn)的結(jié)果:

細(xì)微思路的發(fā)現(xiàn)、并將該思維實(shí)現(xiàn)產(chǎn)品中逐漸放大化,最終實(shí)現(xiàn)體系走向產(chǎn)品運(yùn)營。