开源工具

ExtractThinker：一款灵活的开源文档智能工具，利用大语言模型 ( LLMs ) 从文档中提取结构化数据。

银杏AI

02 1月 2025 — 2 min read

ExtractThinker 是一款灵活的文档智能工具，它利用大型语言模型 ( LLMs ) 从文档中提取结构化数据并进行分类，其功能类似于 ORM，可实现无缝文档处理工作流程。

该工具支持PDF、图片、表格等多种格式，可以自定义提取规则、自动分类、自动判断文件类型，并根据不同的类型提取不同的信息。支持异步处理大文档，批量处理多个文档。

关键特性

灵活的文档加载器：支持多种文档加载方式，包括Tesseract OCR、Azure表单识别器、AWS Textract、Google文档AI等。
可定制的提取：使用Pydantic模型定义自定义提取，以实现精确的数据抽取。
高级分类：使用自定义分类和策略对文档或文档部分进行分类。
异步处理：利用异步处理高效管理大型文档。
多格式支持：无缝处理各种文档格式，如PDF、图像、电子表格等。
ORM风格交互：以类似ORM的方式与文档和语言模型（LLM）交互，以便直观开发。
分割策略：实施惰性或急切的分割策略，以逐页或整体处理文档。
与LLM集成：轻松集成不同的语言模型提供商，如OpenAI、Anthropic、Cohere等。
社区驱动开发：受LangChain生态系统启发，专注于智能文档处理。

Read more

字节豆包大模型团队提出稀疏模型架构,推理成本最高可降低83%

《科创板日报》12日讯，据豆包大模型团队消息，字节跳动豆包大模型Foundation团队近期提出UltraMem，一种同样将计算和参数解耦的稀疏模型架构，在保证模型效果的前提下解决了推理的访存问题。据介绍，该架构有效解决了MoE推理时高额的访存问题，推理速度较MoE架构提升2-6倍，推理成本最高可降低83%。

《黑天鹅》作者：英伟达还会跌2-3倍！

快科技2月3日消息，《黑天鹅》一书的作者、著名风险分析师纳西姆·塔勒布（Nassim Taleb）认为，英伟达股价暴跌或仅是更大灾难的开端。近日，塔勒布在迈阿密对冲基金周上向媒体表示，英伟达接下来的跌幅可能会是1月27日周一（17%下跌）的两到三倍。他表示，这是人们适应现实的开始，并补充说，英伟达的股票表现不再完美无缺，而且已经开始出现裂痕。抛售发生之际，投资者担心美国顶级科技股可能被高估，尤其是在人工智能领域。勒布将这种情况与1999 年的互联网泡沫进行了比较，称早期的互联网投资者押注AltaVista（当时全球最知名的搜索引擎公司）——只是谷歌后来脱颖而出并占据主导地位。他指出，市场现在已经意识到英伟达并非绝对永远上涨，之前被忽视的风险逐渐暴露。随着AI开发成本的降低，企业可能会减少对高价芯片的依赖，或转向定制化解决方案，这将进一步冲击英伟达的营收预期。投资者对英伟达乃至西方科技股的信心动摇，可能引发更大规模的抛售。今年1月，中国人工智能初创企业深度求索公司发布最新开源模型R1，打破人工智能开发“越大越好”迷思。据美国市场观察网站报道，英伟达公司市值在过

最快的N卡和最快的A卡跑DeepSeek谁更快：RTX 5090比RX 7900 XTX快一倍

快科技2月2日消息，最快的N卡和最快的A卡跑DeepSeek谁更快？最新消息显示，RTX 5090在DeepSeek R上的推理性能比AMD的 RX 7900 XTX快得多，性能至少翻了一倍。测试显示，在多个DeepSeek R1型号中，RTX 5090明显领先于RX 7900 XTX，也比RTX 4090快了不少。在Distill Qwen 7b和Distill Llama 8b模型中，该RTX 5090每秒可运行200个Tokens，几乎是RX 7900 XTX 的两倍。 1月31日，NVIDIA宣布，NIM已经可以使用DeepSeek-R1。NIM，即NVIDIA Inference Microservices，是一种云原生微服务技术，可简化生成式AI模型在云端、数据中心及GPU加速工作站上的部署流程 NVIDIA官网发布文章指出，DeepSeek-R1是最先进的推理开放模型，会对查询进行多次推理处理，使用连锁思维、共识和搜寻方法来生成最佳答案。文章写道，为了帮助开发者安全地试验这些功能，并构建自己的专门代理，DeepSeek-R1模型现已作为NVIDIA NIM

SVFR：通用视频人脸修复的统一框架

SVFR 是一种用于人脸视频修复的统一框架，支持BFR、着色、修复等任务以及它们在一个内聚系统中的组合。 SVPR 由厦门大学和腾讯优图实验室推出，能够实现很好的视频人脸修复效果。我们截取了一些使用SVPR的例子。就例子来看，SVFR还能通过绘制蒙版去除视频中的水印，非常适合用来修复老旧的黑白色彩、低分辨率或是包含水印的视频。