此專案為網頁爬蟲和 Flask 網站開發練習
-
利用 Blueprint 將原本的 main.py 拆分成多個獨立模塊
-
利用 jinja2 繼承樣板功能,將重複使用到的 html 元素分離
-
使用 Echarts 呈現數據結果
-
PTT 新聞資料使用 aiohttp 及 asyncio 套件實作 "非同步" 爬蟲 ( 節省時間約 80% )
-
文字雲功能
相關連結
- 非同步 - 非同步介紹
- Python==3.8.5
-
Flask==3.0.3 ( 如果 flask 太舊的話,Blueprint 物件可能沒有 register_blueprint 功能 )
-
bs4==0.0.2
-
flask-paginate==2024.4.12
-
mysql-connector-python==9.0.0
-
requests==2.32.3
-
selenium==4.27.1
-
大盤指數
-
股市新聞
-
文字雲
- 個股指標
大盤指數 :
-
顯示台股大盤指數,開盤、最高、最低、收盤及成交量(億)
-
顯示各類股指標
股市新聞 :
-
顯示 PTT 及 聯合新聞網資訊
-
可以使用搜尋欄分別查詢平台、作者、推文數
文字雲 :
- 將新聞資料庫中標題進行分詞後製作成文字雲圖檔
個股指標 :
- 因尚未開發完成,若使用者點選該路由,會顯示 "尚未開放~~"
- 建立資料夾,並將終端機導引到該資料夾
cd "資料夾路徑"
- git clone 專案
git clone "請放專案路徑"
- 建立虛擬環境
python -m venv .venv
- 安裝套件
pip install -r requirements.txt
- 啟動伺服器
python main.py




