结构化设计语言特点_结构化设计语言提供什么

2024-12-2920:33:11创业资讯1

关于Ubuntu24.04系统上安装LangChain、Ollama和Qwen2并执行前期教程的说明:

  • 在安装完毕后,我们将进行一系列的配置,以便能够从非结构化文本中提取结构化信息。
  • 请注意,本教程仅适用于支持tool calling的模型,如llama3.1版本。而gemma2和qwen2这类模型则不支持tool calling功能。
  • 我们将通过实践来详细解释如何定义和运用信息提取的方法。

本课程中,我们将构建一个信息提取系统,该系统能够从文本中提取出结构化的信息。为了达到这一目的,我们需要先明确我们希望从文本中获取哪些信息。

为了方便信息提取,我们将使用Pydantic框架来定义一个名为Person的方法。这个方法将帮助我们从文本中提取个人信息。

在定义此类方法时,有两个重要的实践建议:

  1. 记录属性和架构:这些信息将被发送到LLM(大型语言模型),以帮助提高信息提取的准确性。这也是一个良好的实践,因为它可以提供给模型更多的上下文信息。
  2. 避免LLM编造信息。在定义属性时,我们可以使用Optional修饰符,这样当文本中没有相关信息时,模型可以输出None而不是编造一个可能不准确的值。

为了确保模型的性能和准确性,我们需要详细记录架构信息,并确保如果文本中没有要提取的信息,模型不会随意返回结果。

接下来,我们将根据上面定义的架构来创建一个信息提取器。这个过程需要使用支持函数/工具调用的模型。

请查阅相关文档,了解可以与此API配合使用的模型列表。这将帮助您选择最适合您需求的模型。

下面是一个完整的程序示例,让我们来测试一下它的效果。

测试结果:

提取出的信息是:[具体信息]

LLM作为生成模型,具有强大的能力。它可以正确地从以英尺为单位的描述中提取出人的身高信息,并将其转换为米单位,这真是非常酷的事情!

  • 版权说明:
  • 本文内容由互联网用户自发贡献,本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 295052769@qq.com 举报,一经查实,本站将立刻删除。