數(shù)據前處理和結構性思維
一、數(shù)據前處理
在做機器學習時候,有的模型需要將數(shù)據處理后才能訓練。見過兩種數(shù)據處理類型,一個是歸一化,另一個是正態(tài)化。有點疑問!
就拿歸一化的來說。假設現(xiàn)在有一組身高和體重的數(shù)據,本來是1米5到2米的人身高,為什么可以通過極差標準化變成0到1的數(shù)值?不會有影響嗎?
既然有“為什么可以”,就有“為什么不可以”。對呀,為什么不可以呢?我在想,一組數(shù)據是不是有其抽象的特征,只要保證特征一致,就可以對其運算。
在知乎看到博主也有相關問題,但是沒有給出合理的答復。
應該要向up主“老奇好好奇”學習,既有對問題的敏感,也要有刨根問底的實踐。比如為了解極化碼,一直找到信息論鼻祖香農的論文。「鏈接」
放到這件事情,要找到是誰最早做了歸一化。英文太差是主要的限制因子,但是也只有開始了才能變好。人在床上躺,水平沒法漲。
二、結構化思維
聽到已經習以為常的詞“找規(guī)律”,突然迸發(fā)出不一樣的感覺。要靠練,聚類然后套規(guī)律。對有些類型的問題,自然就有兩種思路。
比如說,當同學吐槽大學幾年下來也沒有找到對象。腦中立即有了兩種思路。是你去加入社團,參加活動努力找了?還是根本就沒有行動,然后說沒有找到?
還有當我們和Chatgpt對話時,問經營分析報告應該怎么寫,它立刻就能給出一二三四。所以要善用工具,站在巨人的肩膀上,少拍腦袋憑空創(chuàng)造。
很多事情有了不同角度時,自然就是結構化的。
三、少看吐槽,多找解決辦法
研究生入學考試中的英語試題,尤其是閱讀理解,總有一兩個模棱兩可的,觀察網絡上相關吐槽支持眾,接下來就是應試教育沒有辦法云云,再上升到階級固化,生活壓力之類。好像社會陰暗,幸災樂禍,得到共鳴。但是有解決問題嘛?沒有。
聯(lián)系到社會上一些現(xiàn)象,比如被行政拘留的陳某龍,因為捏造怒懟加班文化的聊天記錄。那些發(fā)泄的文字爽嗎?當然。但是有解決問題嘛?沒有。
吐槽的東西,抱怨的東西聽聽就夠了。重要的是解決辦法。

如同我們遇到對方只是一味給予負能量,說你這不行那不行,肯定辦不到,還是少接觸這樣的人好,更不必說交朋友了。如果對方不僅指出問題,還提出了解決辦法,那還是不錯的。

原發(fā)布時間:2023-04-12 11:57