雖然收集和分析“大數(shù)據(jù)”存在一些分析和技術(shù)方面的挑戰(zhàn),但事實(shí)上大部分公司已經(jīng)能夠應(yīng)對(duì)這種挑戰(zhàn)。這是因?yàn)橛幸恍┓浅?qiáng)大的分析工具都是免費(fèi)、開源的,可以充分利用這些工具來提升自己的能力。
Alex Jones推薦了10個(gè)針對(duì)企業(yè)的大數(shù)據(jù)分析工具,這些工具不僅免費(fèi)、使用方便,而且具有強(qiáng)大的功能和良好的資源。
1、Tableau Public
這是一個(gè)簡(jiǎn)單直觀的可視化工具。它在商業(yè)活動(dòng)中表現(xiàn)的很強(qiáng)大,因?yàn)樗ㄟ^可視化來表達(dá)。它有足夠的空間和免費(fèi)使用時(shí)長(zhǎng)讓你體驗(yàn),在分析的過程中,Tableau的圖片呈現(xiàn)可以讓你快速的調(diào)查一個(gè)假設(shè)、驗(yàn)證你的直覺,做更好的商業(yè)決策。
2、OpenRefine
它是以前的GoogleRefine,OpenRefine是一款數(shù)據(jù)清理軟件,可以對(duì)準(zhǔn)備好的一切數(shù)據(jù)進(jìn)行分析。例如最近我清理了一個(gè)含有化學(xué)名稱的數(shù)據(jù)庫,并且各行有不同的拼寫、大小寫、空格等,用計(jì)算機(jī)來處理非常困難,幸運(yùn)的是, OpenRefine包含許多聚類算法,對(duì)這個(gè)問題可以快速解決。
Tip:可以用 IncreaseJava Heap Space 處理文件。
3、KNIME
KNIME可以通過可視化編程的方式來操作、分析和建模。不僅可以寫代碼。你還可以在操作中建立聯(lián)系節(jié)點(diǎn)?;旧夏阒恍枰獙⒐δ苣K拖拽到工作區(qū),并將模塊按照運(yùn)行流程連接起來,就可以實(shí)現(xiàn)以往編程才能實(shí)現(xiàn)的工作。更重要的是,KNIME可以擴(kuò)展到運(yùn)行R, python, text mining,chemistry data等等,這可以讓你選擇用更先進(jìn)的編碼來分析。
Tip:讀取CSV文件時(shí)需要用“File Reader”代替CSV閱讀器。
4、RapidMiner
和KNIME類似, RapidMiner通過可視化編程操作,建模和分析數(shù)據(jù)。最近,RapidMiner贏得kdnuggets的軟件調(diào)查。
5、GoogleFusion Tables
這是針對(duì)數(shù)據(jù)分析、大數(shù)據(jù)集的可視化和映射的一個(gè)非常強(qiáng)大的工具,谷歌的地圖軟件在其中起著重要作用。拿下面這張圖來說,這是一張墨西哥灣石油生產(chǎn)平臺(tái)的圖,我只需要上傳數(shù)據(jù),Google Fusion Tables確認(rèn)維度和經(jīng)度的數(shù)據(jù)之后就開始工作了。
6、NodeXL
NodeXL是針對(duì)網(wǎng)絡(luò)和關(guān)系的可視化分析軟件。想想科技巨頭地圖上代表LinkedIn或Facebook的連接,NodeXL提供了進(jìn)一步精確的計(jì)算。如果你在不需要那么先進(jìn)的東西,你可以看看Google Fusion Tables,或者嘗試用Gephi。
7、import.io
從網(wǎng)上抓取網(wǎng)頁和信息曾經(jīng)是技術(shù)人員的專利,現(xiàn)在用import.io,每個(gè)人都可以從網(wǎng)站和論壇獲取數(shù)據(jù)。簡(jiǎn)單提出你想要的數(shù)據(jù),幾分鐘之后import.io就可以通過你的搜索知道你在找什么,從而會(huì)挖掘、提供數(shù)據(jù)用于你的分析或輸出。
8、Google Search Operators
不可否認(rèn)谷歌最初是一個(gè)強(qiáng)大的資源和搜索公司,運(yùn)營(yíng)商可以讓你快速過濾掉谷歌的結(jié)果得到的最有用的和相關(guān)的信息。比如說,你正想從ABC咨詢里尋找一個(gè)今年的數(shù)據(jù)科學(xué)報(bào)告。如果我們認(rèn)為該報(bào)告可能是PDF格式的,可以搜索
“數(shù)據(jù)科學(xué)報(bào)告”網(wǎng)站::ABCConsulting.com Filetype:PDF
然后在下面的搜索欄,使用“搜索工具”來屏蔽去年的結(jié)果。這在發(fā)現(xiàn)新的信息或市場(chǎng)研究方面非常有用。
9、Solver
Solver是一個(gè)在excel中做優(yōu)化和線性規(guī)劃的工具,允許你設(shè)置一些約束條件(例如不超過什么價(jià)格,要在哪天之前完成之類)。雖然更有效的優(yōu)化可能會(huì)需要另一個(gè)程序(例如R的優(yōu)化包),但是Solver應(yīng)用范圍比較廣。
10、WolframAlpha
Wolfram Alpha的搜索引擎是一個(gè)隱藏的寶石,可以媲美蘋果的Siri。WolframAlpha類似于不那么智能的Google,對(duì)科技搜索提供詳細(xì)的回復(fù),對(duì)微積分作用也能快速的搜索。對(duì)企業(yè)用戶來說,它提供了信息圖表,對(duì)歷史價(jià)格、商品信息、主題概述。
雖然這些工具使得分析更簡(jiǎn)單,但他們只是把信息放進(jìn)去然后進(jìn)行分析,這些你自己也可以做到。所以用一點(diǎn)時(shí)間來學(xué)習(xí)新的技巧,用這些工具來提高自己完成工作。