Skip to content

syh053/crawler_practice

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

21 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Python 爬蟲程式與資料視覺化開發

此專案為網頁爬蟲和 Flask 網站開發練習

  • 利用 Blueprint 將原本的 main.py 拆分成多個獨立模塊

  • 利用 jinja2 繼承樣板功能,將重複使用到的 html 元素分離

  • 使用 Echarts 呈現數據結果

  • PTT 新聞資料使用 aiohttp 及 asyncio 套件實作 "非同步" 爬蟲 ( 節省時間約 80% )

  • 文字雲功能

相關連結


Python 及套件版本

Python 版本

  • Python==3.8.5

套件版本

  • Flask==3.0.3 ( 如果 flask 太舊的話,Blueprint 物件可能沒有 register_blueprint 功能 )

  • bs4==0.0.2

  • flask-paginate==2024.4.12

  • mysql-connector-python==9.0.0

  • requests==2.32.3

  • selenium==4.27.1


專案簡介

目前開發的路由為

  • 大盤指數

  • 股市新聞

  • 文字雲

開發中路由

  • 個股指標

大盤指數 :

  • 顯示台股大盤指數,開盤、最高、最低、收盤及成交量(億)

  • 顯示各類股指標

股市新聞 :

  • 顯示 PTT 及 聯合新聞網資訊

  • 可以使用搜尋欄分別查詢平台、作者、推文數

文字雲 :

  • 將新聞資料庫中標題進行分詞後製作成文字雲圖檔

個股指標 :

  • 因尚未開發完成,若使用者點選該路由,會顯示 "尚未開放~~"

執行專案方法

  1. 建立資料夾,並將終端機導引到該資料夾
cd "資料夾路徑" 
  1. git clone 專案
git clone "請放專案路徑"
  1. 建立虛擬環境
python -m venv .venv
  1. 安裝套件
pip install -r requirements.txt
  1. 啟動伺服器
python main.py

預覽

大盤指數

大盤指數-圖片

類股指數

類股指數-圖片

股市

股市新聞-圖片

新聞雲

新聞雲-圖片

個股指標

個股指標-圖片

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors