ExtractThinker:一款灵活的开源文档智能工具,利用大语言模型 ( LLMs ) 从文档中提取结构化数据。

ExtractThinker:一款灵活的开源文档智能工具,利用大语言模型 ( LLMs ) 从文档中提取结构化数据。

ExtractThinker 是一款灵活的文档智能工具,它利用大型语言模型 ( LLMs ) 从文档中提取结构化数据并进行分类,其功能类似于 ORM,可实现无缝文档处理工作流程。

该工具支持PDF、图片、表格等多种格式,可以自定义提取规则、自动分类、自动判断文件类型,并根据不同的类型提取不同的信息。支持异步处理大文档,批量处理多个文档。

关键特性

  • 灵活的文档加载器:支持多种文档加载方式,包括Tesseract OCR、Azure表单识别器、AWS Textract、Google文档AI等。
  • 可定制的提取:使用Pydantic模型定义自定义提取,以实现精确的数据抽取。
  • 高级分类:使用自定义分类和策略对文档或文档部分进行分类。
  • 异步处理:利用异步处理高效管理大型文档。
  • 多格式支持:无缝处理各种文档格式,如PDF、图像、电子表格等。
  • ORM风格交互:以类似ORM的方式与文档和语言模型(LLM)交互,以便直观开发。
  • 分割策略:实施惰性或急切的分割策略,以逐页或整体处理文档。
  • 与LLM集成:轻松集成不同的语言模型提供商,如OpenAI、Anthropic、Cohere等。
  • 社区驱动开发:受LangChain生态系统启发,专注于智能文档处理。

Read more

NVIDIA RTX 50 系列显卡参数速览,5090 拥有 4090 的 2.5 倍 AI 性能

NVIDIA RTX 50 系列显卡参数速览,5090 拥有 4090 的 2.5 倍 AI 性能

NVIDIA 于今天发布 RTX 50 系列显卡。银杏AI第一时间整理了相关参数数据,附上 RTX 5090 D 的数据和 RTX 4090 的数据作为对比。 具体参数如下表。其中 RTX 5090 拥有 3352 TOPS Tensor Core 算力,约为 4090 的 2.5 倍。RTX 5090使用 GDDR7 显存,显存大小为 32GB。RTX 5070 Tensor Core 算力约为 4070 的两倍,显存带宽约为 4070 的 1.3 倍。 NVIDIA

NVIDIA 新一代旗舰显卡 RTX 5090 正式发布:定价1999美元

NVIDIA 新一代旗舰显卡 RTX 5090 正式发布:定价1999美元

快科技1月7消息,2025 CES消费电子展(1月7日至10日,美国拉斯维加斯)开幕在即。北京时间1月7日 (星期二)上午10:30,NVIDIA举办主题演讲,CEO黄仁勋担任主讲。 黄仁勋身着新皮衣亮相,一点也不废话,上来就公布了RTX 50系列Blackwell显卡的价格,一共四款: RTX 5090售价1999美元、RTX 5080 售价999美元、RTX 5070 Ti售价749美元,RTX 5070售价549美元。 其中,RTX 5080将于1月21日率先上市。 怎么样,惊不惊喜,意不意外? 公布价格之前,黄仁勋还特别提到了RTX 4090的价格。去年它的首发价是1599美元,而如今RTX 5070用549美元,就可以提供和4090相媲美的性能。 以RTX 5090售价1999美元的价格来看,折合人民币是1.46万元左右,国内大家可以猜猜。 规格方面,这一代RTX 50系列带来了重大的硬件升级,包括 PCle

ZLUDA 又一次复活 :在 AMD 显卡上运行基于 CUDA 的应用程序

ZLUDA 允许在非 NVIDIA GPU 上运行未经修改的 CUDA 应用程序,由 Andrzej Janik 发布,于 2020 年首次出现,起初它支持 Intel 显卡,CUDA 被称为 Nvidia 在人工智能领域的护城河,是人工智能生态中的重要一环。 然而,ZLUDA 于 2021 年 2 月从 GitHub 上被下架,Janik 的理由是“私人原因”。这与英特尔和 AMD 有关。当 Janik 第一次开始开发 ZLUDA 时,他是英特尔员工,正在内部游说公司采用它。英特尔要求 Janik 在评估该项目时取消该项目,但正如开发人员所说,“英特尔认为没有在英特尔 GPU