Chapter 3 -- Graph ( 2 )

發表於 2019-10-11 更新於 2026-03-13 分類於課程筆記 Course ，江蕙如 Algorithm Disqus：

Representing Graph

$G=(V,E)$ is a graph

$\mid V\mid=$ the number of nodes $\overset{let}{=} n$
$\mid E\mid=$ the number of edges $\overset{let}{=} m$
$\Longrightarrow n-1\leq m\leq \displaystyle{\binom{n}{r}} \leq n^2$
$\Longrightarrow$ 我們會希望整個複雜度可以控制在 $O(m+n)$

閱讀全文 »

Reinforcement Learning

發表於 2019-10-11 更新於 2026-03-13 分類於課程筆記 Course ，李宏毅 Machine Learning Disqus：

Reinforcement Learning

Reinforcement Learning 整個概念大概就如上圖 :

環境狀態 (State of Environment) 經由機器觀察 (Observation of Machine) 後會做出一些行為 (Action) 來改變環境狀態。而改變後的環境狀態除了依舊會經由機器觀察促使 Machine 做出一些行為外，同時也會對 Machine 給予其獎賞 (Reward)，因此，Reinforcement Learning 就是經由這些正負獎賞使 Machine 可以去學習如何採取 Action，讓 Reward 最大化。

閱讀全文 »

Transfer Learning 遷移學習

發表於 2019-10-11 更新於 2026-03-13 分類於課程筆記 Course ，李宏毅 Machine Learning Disqus：

當我們要進行某一個任務時，或許可能會遇到一個問題 :
「與這個任務直接相關的資料並不多，但與任務不直接相關的資料卻不少」

( 當然，這是一個比較冠冕堂皇的理由，大多時候我們想問的是，我們能不能從別人已經完成的任務中，借鑒對方的經驗來讓我們的任務能夠更有效率地完成 )

閱讀全文 »

Anaconda 環境安裝 ( Win 10 )

發表於 2019-10-08 更新於 2026-03-13 分類於軟體 Software Disqus：

What’s Anaconda ?

在資料處理及機器學習的應用上，Python是大家所熟知的程式語言，而Anaconda便是實現Python的一個極受歡迎平台。
這個平台之所以好用，最重要的一個原因便在於它內包了許許多多的資料科學套件，你不需要一個一個下載，靠著Anaconda的一鍵安裝幾乎就能讓你完成90%以上的資料處理工作。(不過相對來說你下載的套件也不見得都會用到就是了XD)

閱讀全文 »

Win10 系統下進行 XGBoost CPU / GPU 的安裝

發表於 2019-10-08 更新於 2026-03-13 分類於軟體 Software Disqus：

XGboost 一直是 Kaggle 個項目中前段班最愛用的演算法之一，之前就一直想要安裝，但總聽聞 XGboost 在 Windows 系統下安裝十分麻煩，在尚未要用到之前，我也就一直擺著沒有去安裝，直到最近開始接觸，便想著該來鼓起勇氣安裝 XGboost 了….

閱讀全文 »

更改 jupyter notebook起始路徑

發表於 2019-10-08 更新於 2026-03-13 分類於軟體 Software Disqus：

正常 jupyter notebook 的開啟路徑都在 C:\users 內，但相信很多人真正在處理資料的地方都在另外一個資料夾，也當然希望 jupyter notebook 開啟後可以直接處理檔案，不需要一直切換路徑。

在這裡，提供一些小撇步，讓路徑可以隨自己的喜好來設定。

閱讀全文 »

Kaggle Case - Santander Customer Transaction Prediction (3)

發表於 2019-10-08 更新於 2026-03-13 分類於案例討論 Case Study Disqus：

本篇為此系列文中第三篇，若還沒有讀過前文的讀者，建議從” Kaggle Case - Santander Customer Transaction Prediction (1) “開始閱讀唷 !

閱讀全文 »

Kaggle Case - Santander Customer Transaction Prediction (2)

發表於 2019-10-08 更新於 2026-03-13 分類於案例討論 Case Study Disqus：

本篇為此系列文中第二篇，若還沒有讀過前文的讀者，建議從” Kaggle Case - Santander Customer Transaction Prediction (1) “開始閱讀唷 !

閱讀全文 »

Kaggle Case - Santander Customer Transaction Prediction (1)

發表於 2019-10-08 更新於 2026-03-13 分類於案例討論 Case Study Disqus：

在這一個 Kaggle Challenge中，Santander提供了20萬筆的Train Data以及20萬筆的Test Data，希望Kagglers可以建構出一個模型來預測他們客戶是否能夠跟Santander進行交易。

在這邊，我選擇以Gabriel Preda的Kernel來進行第一次的Kaggle Case研讀，也藉此了解一般在進行EDA以及Feature Engineering時可能會遇到的方法及解決的方式。

閱讀全文 »

[文章] Building a Content Based Recommender System for Hotels in Seattle

發表於 2019-10-08 更新於 2026-03-13 分類於文章 Article Disqus：

Susan Li .(2019 , Apr 1). Building a Content Based Recommender System for Hotels in Seattle .Retrieved June 27,2019 ,from https://towardsdatascience.com/building-a-content-based-recommender-system-for-hotels-in-seattle-d724f0a32070

閱讀全文 »