今天小编分享的科学经验:3人干翻谷歌!免费学术搜索比谷歌学术相关性高5倍,已获YC投资,欢迎阅读。
三人团队打造的学术搜索引擎,直接拿下 SOTA!
号称搜索结果相关性平均比谷歌学术高 5 倍,能搜索超 1 亿个研究对象,还不依赖 LLM。
更重要的是:免费,学生党狂喜!
先来看一波使用效果,输入搜索关键词,只需 350 毫秒," 啪 " 得一下高度相关文献就列出来了:
还能再一键筛选出可查看 PDF 的檔案。
从年份、引用次数,到出版类型、具体期刊,都能设定一键过滤:
搜索出来的论文,点击题目即可预览,支持一键复制常见学术引用格式:
这个新搜索引擎名叫Lumina,据说目前已处理了超 30 万次查询,支持 24 种语言。
为了和谷歌学术等传统学术搜索引擎做比较,开发团队还专门搞了个基准测试,代码库也已开源放了出来,测试结果 Lumina 搜索结果的相关性拿下 SOTA。
开发者发推文叫板谷歌:
我们三个人花几个月就做出来了,比谷歌的好。
AI 3D 模拟引擎 Ego 联合创始人兼 CTO、前 Meta 研究员看过后表示闭眼冲:
强烈推荐大家试一试。
还有不少学者表示好使:
搜索相关性最高高 11 倍
如开头所述,为了测试 Lumina 的性能,研究团队开源了一个基准测试。
使用 GPT-4 作为 " 评判员 ",重点比较了 Lumina Base(基础搜索模式)、Lumina Recursive(递归搜索模式)、Semantic Scholar 和谷歌学术搜索结果的相关性和精确度。
直接检测评估了每个搜索引擎的前 10 个搜索结果,对比如下:
在基础搜索模式下(Lumina Base),Lumina 搜索结果的相关性比谷歌学术高 4.8 倍,比 Semantic Scholar 高 8 倍,评估基于生成的约 2470 个查询数据集。
Lumina 在递归搜索模式下,搜索结果相关性进一步提升,比谷歌学术高 6.8 倍,比 Semantic Scholar 高 11.3 倍,同样基于 2470 个查询数据集。
此外,Lumina 在每次检索中都能稳定提供 2-3 个高度相关结果,相比之下,谷歌学术只有 50% 的检索能提供 1 个高度相关的结果,Semantic Scholar 则仅有 30% 的检索能达到这一标准。
换句话说,Lumina 可以找到原本很难找到的研究成果。
团队还表示,使用 Lumina API 和一个简单的递归脚本,可以使相关性比谷歌学术高 11 倍,Lumina API 即将发布。
除了基本的检索,Lumina 还提供AI 概述功能。
比如用 " 机器学习 " 关键词搜索,它就会引用检索出来的论文总结介绍机器学习:
点击 AI 概述中有下划线的关键词,就会触发对该关键词的进一步检索:
AI 概述下方还有对搜索论文研究成果图表的汇总:
三人团队打造
Lumina 背后是一个仅有三人的开发团队,已获 YC 投资。
联合创始人兼 CEO Mehul Chadda,本科毕业于美国威斯康星大学麦迪逊分校材料工程专业,前高精度科学仪器公司 CAMECA 制造工程师,负责过原子探针研发工作。
联合创始人兼 CTO Akhilesh Sharma,本科毕业于美国伊利诺伊大学香槟分校完成机械工程专业,之前是社交媒体平台 Postpress 的联合创始人和技术主管,也曾担任美国技术咨询公司 Neudesic 云技术相关顾问。
联合创始人 Ishaan Kapoor,加州大学洛杉矶分校统计学毕业,对深度学习、线性代数和大语言模型感兴趣。
除了这次上新的学术搜索引擎,之前团队还做了一个 AI 论文解读工具——Lumina-chat。
点击 Lumina 主页右上角的 "Legacy System" 即可跳转使用。
打开后是这样婶儿的,可以上传 PDF 与 AI 互動进行论文解读:
感兴趣的童鞋可以试试~
https://lumina.sh/c5bbe32b-4fb7-476a-81aa-fe269f67f283
参考链接:
[ 1 ] https://x.com/lumina_ai_inc/status/1823810207576941047?s=46&t=iTysI4vQLQqCNJjSmBODPw
[ 2 ] https://x.com/Ishaank1999
[ 3 ] https://x.com/notakhilesh99
[ 4 ] https://x.com/bada_aaya