五大知识板块
基因组、转录组、蛋白组、生物网络、计算机辅助药物发现。
Bioinformatics Introduction Portal
基于 Transformer 语义检索、图像近邻文字摘取与相似度打分机制, 从课程 PPTX 幻灯片中抽取知识,结合旧题风格生成新题。 支持在线答题、抽题测试与知识模块阅读。
基因组、转录组、蛋白组、生物网络、计算机辅助药物发现。
支持 PPTX、PDF、DOCX、Markdown、JSON 等多种文档格式输入。
BM25 + TF-IDF + RapidFuzz + Sentence-Transformer 四路混合检索。
从 PPTX 幻灯片中自动提取标题、正文、备注,生成结构化知识库(962 条知识条目)。
基于旧题风格,通过混合检索匹配相似题目,适配新知识生成高质量选择题。
支持按主题、题型筛选,卡片式作答、抽题测试、即时判分与浏览器本地记录。
BioIntro 的题目生成流程涉及以下关键算法。
直接解析 PPTX/DOCX 的 XML 结构,提取标题占位符、正文与备注。
中文分词后构建 BM25 索引,实现高效的词汇级检索。
基于 n-gram TF-IDF 向量化,计算余弦相似度进行风格匹配。
可选 Sentence-Transformer 语义嵌入,实现深层语义检索。
围绕练习、阅读与题库扩展组织主要功能。
浏览 100 道旧题 + 生成新题,在线作答、抽题测试、导出。
围绕知识模块组织阅读,查看事实、答案解析和关联题目。
查看 functions 和示例数据结构,迁移到你自己的知识库项目。