Math.py

古典線性模型 v.s 廣義線性模型

發表於 2020-03-25 更新於 2026-03-13 分類於深度學習 Deep Learning Disqus：

前言

撰寫此文主要受 “剖析深度學習 (4)：Sigmoid, Softmax怎麼來？為什麼要用MSE和Cross Entropy？談廣義線性模型“ 一文所激勵。

[論文] Simultaneous Localisation and Mapping (SLAM) : Part I The Essential Algorithm

發表於 2020-03-02 更新於 2026-03-13 分類於論文 Paper Disqus：

筆者前言

此篇論文距今已有十多年歷史，但就初入 SLAM 領域的初心者來說，這仍是一篇入門的論文可讓我們以極短時間了解 SLAM 的整個核心概念與一些經典的解決方法。但雖說入門，仍然需要不少的先備知識 (例如 : 機率統計、卡爾曼濾波器、粒子濾波器….) ，要能完全掌握也必須要花一些時間。

比較需要注意的是，這篇真的僅是入門，不能作為理解 SLAM 問題的全貌，畢竟在 2006年以後到現在，十多年的時間也發展了不少新技術，更有甚者結合了 Deep Learning 有更好的 performance，但我相信在此論文的基礎下，去了解最新技術會相對來說簡單一些，而這也是我會選擇閱讀此篇論文的主要原因之一。

另外，本篇論文筆記會加入一些補充資料在其中，以利完全沒有相關經驗及先備知識的讀者在進行論文閱讀時能更加清楚整個論文的內容。因此整篇論文筆記的內容或許會與原文有一些差異，並不會完全相同，在對照原始論文時可能要稍微注意的地方。

閱讀全文 »

Android 初探 (二) ：從 Hi, Android ! 來認識 Activity 與 UI

發表於 2020-03-02 更新於 2026-03-13 分類於系統相關 OS ， Android Disqus：

前言

上一篇文章 “ Android 初探 (一) ： Android 初探 (一) ：從 Hello World ! 認識 Android 專案開發 “ 簡單介紹了一個 Android 專案的主要架構以及如何在模擬器上 run 出整個結果，這一篇會著重在一個 Android app是怎麼運作的，以及可以怎麼簡單設計使用者介面。

閱讀全文 »

Android 初探 (一) ：從 Hello World ! 認識 Android 專案開發

發表於 2020-03-02 更新於 2026-03-13 分類於系統相關 OS ， Android Disqus：

前言

在電腦視覺 ( 或是整個 AI 領域 ) 中，針對問題來進行建模，經過不斷的調整參數及模型結構來找出最能解決任務的模型，這些就是工作的全部？

其實並不然。

閱讀全文 »

[論文] YOLOv3 : An Incremental Improvement

發表於 2020-02-15 更新於 2026-03-13 分類於論文 Paper ，物件偵測 Object Detection Disqus：

這篇雖然說看似一篇論文，但整體讀下來比較像是一篇筆記 (作者也說這篇論文它定位為技術文件)，因此這一篇論文閱讀筆記我就以略讀的方式來撰寫，想留一點時間來做一下不同版本 YOLO 之間的比較。

閱讀全文 »

影像畸變 Image Distortion

發表於 2020-02-15 更新於 2026-03-13 分類於影像處理 Image processing Disqus：

在前面的文章 “針孔相機模型 Pinhole Camera Model“ 中我們有提到在一個理想的針孔相機中，一個 3D 目標怎麼投影到 2D 平面上。

但是，實際上一個光學系統必須經由多組鏡頭所組成，在這樣的系統下，單純理想的針孔相機模型便無法擬合真實情況。加入鏡頭、透鏡後，成像必然會有某些程度上的失真、變形，這樣的情況我們稱之為「畸變」(Distortion)。

閱讀全文 »

針孔相機模型 Pinhole Camera Model

發表於 2020-02-06 更新於 2026-03-13 分類於影像處理 Image processing Disqus：

光學基本平面 Cardinal Plane

在搞清楚 Pinhole Camera Model 以前，或許我們要先理解一些專有名詞：

光學基本平面 (Cardinal Plane)
基點（cardinal points）
主平面（principle plane）
主點（principle point）
焦平面（focal plane）
焦點（focal point）

閱讀全文 »

[論文] YOLO9000 : Better, Faster, Stronger

發表於 2020-02-05 更新於 2026-03-13 分類於論文 Paper ，物件偵測 Object Detection Disqus：

概要

在這篇論文中，作者們提出了最先進的即時物件偵測系統 YOLO9000 ，可以偵測超過9000 種物件。首先，針對YOLO進行了各種改善，提出了YOLOv2 。YOLOv2 不管在 PASCAL VOC 或是 COCO 資料集中都有最佳的表現。經過最新穎、多尺度的訓練，YOLOv2 可以運行在各種不同尺寸的資料中，進而在速度與精準度上進行權衡。

閱讀全文 »

Gesture Recognition using YOLO v3 tiny

發表於 2020-01-18 更新於 2026-03-13 分類於專案 Project Disqus：

Introduction

此專案目標是利用 YOLOv3-tiny 進行七組手勢辨識，使用 11 萬張訓練資料以及 4 萬張驗證資料進行 300 epochs 訓練。（仍在訓練中，目前使用的是 60 epochs （訓練時間約80小時）訓練後的權重進行測試）

閱讀全文 »

[論文] 速讀論文 Accurate Hand Keypoint Localization on Mobile Devices

發表於 2020-01-11 更新於 2026-03-13 分類於論文 Paper Disqus：

論文中提出了一個網路結構，可以將一般圖片 ( 未經過處理 ) 輸入後，直接進行手部關鍵點的定位。此方法利用改良過的 VNect[^註1] 來對輸入圖像計算其 Heatmap，再利用此 Heatmap 來進行關鍵點的定位。

閱讀全文 »