日本語は下にあります / Japanese follows below.
A local browser workspace for reconstructing image-based slide decks into editable PowerPoint files.
AI Deck Reconstructor does not generate slides from scratch. Instead, it takes slide images or PDF pages, runs OCR, extracts editable text blocks and visual assets, and rebuilds them as a PowerPoint deck that humans can refine.
UI supports Japanese and English (toggle in the top-right corner).
The OSS app icon is available at docs/images/icon_adr_oss.png.
You may use it for repository pages, website listings, README previews, and local shortcuts related to AI Deck Reconstructor.
Most AI slide generators can create impressive slide images, but fine-tuning those results is often difficult.
AI Deck Reconstructor focuses on the next step:
slide images / PDF pages
→ OCR
→ text blocks
→ asset extraction
→ rebuild specification
→ editable PowerPoint deck
The goal is not one-shot generation. The goal is reconstruction into a deck that can be edited, corrected, and reused.
- Upload slide images
- Upload PDF files and convert pages into slide images
- Paste images from the clipboard
- Drag and drop files into the upload modal
- Reorder slides with up / down controls
- Delete individual source slides
- Clear current source files and generated artifacts
- Run OCR for each slide
- Convert OCR output into editable text blocks
- Review reconstructed text on top of the original slide image
- Apply text blocks to a rebuild specification
- Keep source slide IDs stable across deck reconstruction
- Detect visual asset candidates from slide images
- Accept individual asset candidates
- Accept all detected candidates
- Manually clip image regions as assets
- Toggle whether each asset is used in the PowerPoint export
- Delete individual assets
- Keep asset IDs aligned with generated filenames
- Edit text style and placement
- Adjust theme colors
- Preview original and reconstructed slide states
- Use light / dark UI modes
- Switch UI language between Japanese and English
- Export reconstructed slides as editable
.pptx - Build output decks from the current rebuild specifications
- Preserve editable text and image assets where possible
- Use local files only; no cloud upload is required
Tested on macOS. Linux should work with equivalent dependencies. Windows is not currently supported.
| Requirement | Notes |
|---|---|
| OS | macOS / Linux |
| Python | Python 3.10+ recommended |
| NDLOCR-Lite | Install separately and configure the engine path |
| Flask / Pillow / python-pptx / pdf2image | Installed from requirements.txt |
| poppler | Required for PDF import. Mac: brew install poppler / Linux: apt install poppler-utils |
Install NDLOCR-Lite separately.
This project expects NDLOCR-Lite to be available from the local environment. In the current default setup, the OCR engine path is configured in:
json/ocr_engine_config.json
A common local layout is:
parent-folder/
├── ai-deck-reconstructor/
└── ndlocr-lite/
git clone https://github.com/StateToolsLab/ai-deck-reconstructor.git
cd ai-deck-reconstructorchmod +x install.commandThe installer checks your environment, sets execute permissions, and creates a desktop shortcut.
The launcher creates a local .venv, installs dependencies from requirements.txt, and starts the Flask app.
Double-click AI Deck Reconstructor.command on the desktop.
The launcher opens:
http://127.0.0.1:5050
Recommended browser zoom: 100%. If the layout looks collapsed or broken, reset browser zoom to 100%.
Typical workflow:
- Open or add slide images / PDF files
- Run OCR or process a slide
- Review text blocks and asset candidates
- Accept or adjust extracted assets
- Apply reconstruction rules
- Export an editable PowerPoint deck
To stop the server, press Ctrl+C in the terminal window opened by the launcher.
AI Deck Reconstructor stores repository files and runtime working files inside the project directory.
The repository initially contains config/, docs/, json/, scripts, and ui/. Runtime folders such as source/, assets/, and output/ are created or populated as you use the app.
ai-deck-reconstructor/
├── source/ # Uploaded source slide images
├── assets/
│ └── slide_xxx/ # Extracted image assets
├── json/
│ ├── ocr/ # OCR outputs
│ ├── slides/ # Rebuild specs and asset candidates
│ ├── text_blocks/ # Generated text blocks
│ ├── text_blocks_working/ # Editable working text blocks
│ └── themes/ # User theme configuration
├── output/ # Generated files
└── docs/images/ # README images
Generated source files and assets can be cleared from the UI. Repository files such as README images and configuration files are not removed by source clearing.
This project is in public-preparation / PoC stage.
It is intended for local experimentation with slide reconstruction workflows, especially when working with image-based AI-generated slides that need to become editable PowerPoint files.
- Add launcher files:
install.command,install.sh, andAI_Deck_Reconstructor.command - Clarify repository name and runtime storage in README
- Preserve source slide IDs in deck manifests
- Add slide ordering controls
- Stabilize asset ID and filename alignment
- Improve source clearing behavior
- Add PDF support to the main upload selector
- Add README workspace screenshot
- Remove extra bundled user themes
- Remove internal design notes
- Image slide normalization
- OCR pipeline
- Text block generation
- Rebuild specification generation
- Editable PowerPoint export
This tool uses NDLOCR-Lite, the OCR engine developed by the National Diet Library of Japan.
NDLOCR-Lite license: CC BY 4.0 https://creativecommons.org/licenses/by/4.0/
NDLOCR-Lite を使い、画像化されたスライドやPDFページを、編集可能なPowerPointデッキへ再構成するローカルブラウザツールです。
AI Deck Reconstructor は、スライドをゼロから生成するツールではありません。 画像として出力されたスライドを読み込み、OCR・テキストブロック化・素材抽出・再構成指定を通じて、人間が編集できるPowerPointへ戻すことを目的としています。
UIは日本語・英語に対応しています(画面右上で切り替え)。
OSS版のアプリアイコンは docs/images/icon_adr_oss.png に配置しています。
AI Deck Reconstructor に関連するリポジトリページ、Webサイト掲載、READMEプレビュー、ローカルショートカット等で利用できます。
AIスライド生成ツールは、見栄えのよいスライド画像を作ることができます。 しかし、その後の細かな修正や再利用は難しい場合があります。
AI Deck Reconstructor が扱うのは、その次の工程です。
スライド画像 / PDFページ
→ OCR
→ text_blocks
→ 素材抽出
→ rebuild_spec
→ 編集可能なPowerPointデッキ
目的は、一発生成ではありません。 目的は、編集・修正・再利用できるデッキへ再構成することです。
- スライド画像のアップロード
- PDFファイルのアップロードとページ単位の画像変換
- クリップボード画像の貼り付け
- アップロードモーダルへのドラッグ&ドロップ
- 上下ボタンによるスライド順序変更
- 個別sourceスライドの削除
- 現在のsourceと生成物のクリア
- スライド単位のOCR実行
- OCR結果から編集可能なテキストブロックを生成
- 元画像上で再構成テキストを確認
- text_blocks を rebuild_spec に反映
- source slide ID を維持したdeck manifest生成
- スライド画像から素材候補を検出
- 候補を個別に採用
- 候補を一括採用
- 画像領域を手動でクリップして素材化
- PowerPoint出力に使う素材を切り替え
- 個別素材の削除
- asset ID と生成ファイル名の整合性を維持
- テキストスタイルと配置の編集
- テーマカラーの調整
- Original / Reconstructed の状態確認
- ライト / ダークUI
- 日本語 / 英語UI切り替え
- 再構成されたスライドを編集可能な
.pptxとして出力 - rebuild_spec をもとにデッキを生成
- 可能な範囲でテキストと画像素材を編集可能な形で保持
- すべてローカルで処理し、クラウドへのアップロードは不要
macOSで確認しています。Linuxでも同等の依存関係があれば動作する想定です。Windowsは現時点では未対応です。
| 必要なもの | 備考 |
|---|---|
| OS | macOS / Linux |
| Python | Python 3.10以上推奨 |
| NDLOCR-Lite | 別途インストールし、エンジンパスを設定 |
| Flask / Pillow / python-pptx / pdf2image | requirements.txt からインストール |
| poppler | PDF読み込みに必要。Mac: brew install poppler / Linux: apt install poppler-utils |
NDLOCR-Lite を別途インストールします。
このプロジェクトでは、ローカル環境からNDLOCR-Liteを呼び出せることを前提にしています。 現在のデフォルト構成では、OCRエンジンのパスは以下で管理します。
json/ocr_engine_config.json
一般的なローカル配置例:
parent-folder/
├── ai-deck-reconstructor/
└── ndlocr-lite/
git clone https://github.com/StateToolsLab/ai-deck-reconstructor.git
cd ai-deck-reconstructorchmod +x install.commandインストーラーが環境を確認し、実行権限の設定とデスクトップショートカットの作成を行います。
起動時には、ローカルの .venv を作成し、requirements.txt から依存ライブラリをインストールして、Flaskアプリを起動します。
デスクトップの AI Deck Reconstructor.command をダブルクリックします。
起動後、ブラウザで以下が開きます。
http://127.0.0.1:5050
推奨ブラウザ表示倍率:100%。 ペインやボタンが折りたたまれて見える場合は、ブラウザの表示倍率を100%に戻してください。
基本的な流れ:
- スライド画像またはPDFを開く / 追加する
- OCRまたはスライド処理を実行する
- テキストブロックと素材候補を確認する
- 素材候補を採用・調整する
- 再構成ルールを反映する
- 編集可能なPowerPointとして出力する
サーバーを停止するには、起動時に開いたターミナルウィンドウで Ctrl+C を押します。
AI Deck Reconstructor は、リポジトリファイルと実行時の作業ファイルをプロジェクトディレクトリ内に保存します。
初期状態のリポジトリには config/、docs/、json/、scripts/、ui/ などが含まれます。source/、assets/、output/ などは、アプリの利用に応じて作成または更新されます。
ai-deck-reconstructor/
├── source/ # アップロードされた元スライド画像
├── assets/
│ └── slide_xxx/ # 抽出された画像素材
├── json/
│ ├── ocr/ # OCR結果
│ ├── slides/ # rebuild_spec と asset候補
│ ├── text_blocks/ # 生成されたテキストブロック
│ ├── text_blocks_working/ # 編集用テキストブロック
│ └── themes/ # ユーザーテーマ設定
├── output/ # 生成ファイル
└── docs/images/ # README用画像
UIからsourceと生成物をクリアできます。 README画像や設定ファイルなど、リポジトリ管理対象のファイルはsourceクリアでは削除されません。
このプロジェクトは、公開準備中 / PoC段階です。
画像化されたAI生成スライドを、編集可能なPowerPointへ戻すためのローカル再構成ワークフローを検証する目的で作られています。
install.command、install.sh、AI_Deck_Reconstructor.commandの起動ファイルを追加- README内のリポジトリ名と実行時データ保存場所の説明を整理
- deck manifestでsource slide IDを保持
- スライド順序変更UIを追加
- asset ID とファイル名の整合性を安定化
- source clear時の挙動を改善
- メインアップロード選択でPDFに対応
- README用ワークスペース画像を追加
- 余分なユーザーテーマを削除
- 内部設計メモを削除
- スライド画像の正規化
- OCRパイプライン
- テキストブロック生成
- rebuild_spec生成
- 編集可能なPowerPoint出力
OCRエンジンとして NDLOCR-Lite(国立国会図書館)を使用しています。
NDLOCR-Lite ライセンス:CC BY 4.0 https://creativecommons.org/licenses/by/4.0/
