Math.py

Wir müssen wissen , wir werden wissen

0%

Reinforcement Learning

Reinforcement Learning 整個概念大概就如上圖 :

環境狀態 (State of Environment) 經由 機器觀察 (Observation of Machine) 後會做出一些行為 (Action) 來改變環境狀態。而改變後的環境狀態除了依舊會經由機器觀察促使 Machine 做出一些行為外,同時也會對 Machine 給予其獎賞 (Reward),因此,Reinforcement Learning 就是經由這些正負獎賞使 Machine 可以去學習如何採取 Action,讓 Reward 最大化。

閱讀全文 »

當我們要進行某一個任務時,或許可能會遇到一個問題 : 「與這個任務直接相關的資料並不多,但與任務不直接相關的資料卻不少」

( 當然,這是一個比較冠冕堂皇的理由,大多時候我們想問的是,我們能不能從別人已經完成的任務中,借鑒對方的經驗來讓我們的任務能夠更有效率地完成 )

閱讀全文 »

What's Anaconda ?

在資料處理及機器學習的應用上,Python是大家所熟知的程式語言,而Anaconda便是實現Python的一個極受歡迎平台。 這個平台之所以好用,最重要的一個原因便在於它內包了許許多多的資料科學套件,你不需要一個一個下載,靠著Anaconda的一鍵安裝幾乎就能讓你完成90%以上的資料處理工作。(不過相對來說你下載的套件也不見得都會用到就是了XD)

閱讀全文 »

XGboost 一直是 Kaggle 個項目中前段班最愛用的演算法之一,之前就一直想要安裝,但總聽聞 XGboost 在 Windows 系統下安裝十分麻煩,在尚未要用到之前,我也就一直擺著沒有去安裝,直到最近開始接觸,便想著該來鼓起勇氣安裝 XGboost 了....

閱讀全文 »

正常 jupyter notebook 的開啟路徑都在 C:內,但相信很多人真正在處理資料的地方都在另外一個資料夾,也當然希望 jupyter notebook 開啟後可以直接處理檔案,不需要一直切換路徑。

在這裡,提供一些小撇步,讓路徑可以隨自己的喜好來設定。

閱讀全文 »

在這一個 Kaggle Challenge中,Santander提供了20萬筆的Train Data以及20萬筆的Test Data,希望Kagglers可以建構出一個模型來預測他們客戶是否能夠跟Santander進行交易。

在這邊,我選擇以Gabriel Preda的Kernel來進行第一次的Kaggle Case研讀,也藉此了解一般在進行EDA以及Feature Engineering時可能會遇到的方法及解決的方式。

閱讀全文 »

Visualization Wheel

我們在探討視覺化前,我們先利用 Alberto Cairo 在 the functional art 一書中所提到的 " Visualization Wheel " 來了解針對視覺化評判的標準到底有哪些 ? 也藉此了解到視覺化圖表的要素有什麼。

閱讀全文 »