句影检索台是一个纯前端小工具集合,包含:
- 句子检索(关键词 + embedding 语义搜索)
- CSV 记录回填与 embedding 生成
- 媒体工具(多图转视频、视频拆图、音频转视频)
index.html:检索页面embed-builder.html:CSV 字段编辑 + embedding 生成media-tools.html:媒体转换工具
三个页面顶部都有横向导航,可互相跳转。
主数据文件:
data/search_records.csvdata/search_record_embeddings.csv
data/search_records.csv 表头顺序:
id,original,meaning,synonyms,scene_tags,emotion_tags,relation,location,people_count,youtube,video_download,material_downloadsdata/search_record_embeddings.csv 表头顺序:
id,embedding字段说明:
id:记录主键,用于和 embedding 文件关联original:原句meaning:这句话表达的意思synonyms:近义搜索词,使用|分隔scene_tags:场景标签,使用|分隔emotion_tags:情绪标签,使用|分隔youtube:YouTube 链接(支持 watch / shorts / youtu.be)video_download:视频下载链接,支持多个链接,页面显示为“下载视频”material_downloads:素材下载链接,适合放纯 BGM、人声、贴图等可复用素材,支持多个链接,页面显示为“下载素材”relation:人物关系标签,使用|分隔location:地点标签,使用|分隔people_count:人数embedding:向量 JSON 数组,单独放在data/search_record_embeddings.csv
建议用静态服务器打开(不要直接双击 html):
python3 -m http.server 8080访问:
http://localhost:8080/
- 打开
embed-builder.html - 把现有 CSV 粘贴到“从现有 CSV 行解析并回填”
- 点击“解析并填充表单”
- 修改你要改的字段
- 点击“生成 embedding”
- 复制“主记录 CSV 行”到
data/search_records.csv - 复制“embedding CSV 行”到
data/search_record_embeddings.csv
你可以先让 AI 根据视频/图片产出 CSV 前几列,再转 embedding:
templates/csv_ai_mask_prompt.md
- 首次语义搜索或生成 embedding 时,会在浏览器下载模型,速度取决于网络环境。
- 本项目当前不依赖 Node.js,可直接以静态文件方式运行。
- 已启用基于
version.json的自动缓存版本控制:index.html会先读取version.json再加载index.js?v=<version>。 .github/workflows/update-version.yml会在每次 push 到main后自动把当前 commit SHA 写入version.json。