tech-sjh

2013年12月7日 星期六

使用 python 進行網頁科學

摘譯自
'My Data Is Big Because It Doesn't Load Into R': Why Python Is the Language of Web Science

當資料量大到不能直接交由 STATA/Excel(Google Drive)/R
分析網頁資料時,就該考慮使用 python 幫你預先處理資料格式,
比如將資料庫資料轉為較通用的 csv 檔案格式,再將 csv 資料
載入其他工具或函式庫做分析處理。

網頁科學會以統計學為各學科間的基礎,來進行分析、視覺化處理,
客製化資料格式,也是用來搜集其他網頁,產生新集成資料的平台,
在這領域因為還在發展階段,並不存在最佳解決方法,大家都還在討
論、試圖理論化、實作並進行測試。

Python 的優點是好學好用,語法清楚,套件包山包海,有廣大的開源
社群當你的智囊群。

底下的討論中 Todor Kazakov 提到 http://statace.com/ 提供 R 語言
的雲端服務,讓 R 使用者可以將大量資料處理交給 statace 處理。

(譯註:看完發現 R 的資源也蠻多的啊 XD )



沒有留言:

張貼留言

版權宣告、免責聲明


創用 CC 授權條款
本著作係採用創用 CC 姓名標示-非商業性-相同方式分享 4.0 國際 授權條款授權.
免責聲明: 本文所載資料僅供參考,並不構成投資建議,
讀者閱讀或使用該資料所導致結果需要自擔風險與責任,
作者概不承擔閱讀人行為之任何風險與責任。
除非有特別宣稱,作者言論並不代表所屬任何團體、公司、或其他人意見。