摩杜云开发者社区-摩杜云

使用langchain与你自己的数据对话(一)：文档加载与切割

LangChain是一个基于大语言模型（如ChatGPT）用于构建端到端语言模型应用的Python框架。它提供了一套工具、组件和接口，可简化创建由大型语言模型(LLM)和聊天模型提供支持的应用程序的过程。LangChain可以轻松管理与语言模型的交互，将多个组件链接在一起，以便在不同的应用程序中使用。LangChain可以让LLM来学习您自己的结构化或者非结构化的数据，这些数据包括pdf,text,youtbe,database等，这样就可以很方便的打造一个个性化的智能AI机器人。下面是LangChain可以学习的数据的种类和类型：

Wv2PRSlQRjkP 2023年11月02日 84 0 0 LangChain 文档加载 LangChain 文档分割文档分割文档加载

ChatGPT时代下的通识教育

说实话，昨天是我第一次听说“通识教育”这个名词，我也说不出来为什么，就觉得这个词有很大的吸引力，让我不由自主地想去了解它，当我对它有了大概地了解之后，我很受震撼，我觉得自己实在是太无知了，所以我很想写一下自己地体会，好让更多的人，早点了解通识教育。那么，什么是通识教育？通识教育是英文“LiberalArtsEducation"的译名，也有学者把它译为“普通教育”、“一般教育”、“通才教育”等。从基本定义来看，通识教育是一种不分学科的、全方面的教育，目的是为了培养孩子独立思考和将各学科知识融会贯通的能力。换句话来说，就是博览群书、博学多识，让他们成为一个视野开阔、与人为善、具有理性精神的...

Wv2PRSlQRjkP 2023年11月02日 31 0 0 通识教育通识教育

一文秒懂 TP、FP、FN 到底是个啥玩意

TP、FP、FN是评价分类模型性能的常用指标。之前很多次都会遇到这三个值，每次遇到都要重新查资料，看这三个值是怎么计算的，具体是指什么的？今天终于理解透彻了，所以赶紧来记录一下 TP（TruePositive，真正例）：表示模型正确地将正例预测为正例的数量； FP（FalsePositive，假正例）：表示模型错误地将负例预测为正例的数量； FN（FalseNegative，假负例）：表示模型错误地将正例预测为负例的数量。这样地概念给大家一看，是不是有很多疑惑？下面我们来用大白话来说明一下这三个指标。首先，我们要关注“正确地”和“错误地”这两个形容词，分别表示看gold和pred二者一...

Wv2PRSlQRjkP 2023年11月02日 78 0 0 评价指标评价指标

一文帮助你快速读懂 TP、FP、FN 到底是个啥玩意

TP、FP、FN是评价分类模型性能的常用指标。之前很多次都会遇到这三个值，每次遇到都要重新查资料，看这三个值是怎么计算的，具体是指什么的？今天终于理解透彻了，所以赶紧来记录一下 TP（TruePositive，真正例）：表示模型正确地将正例预测为正例的数量； FP（FalsePositive，假正例）：表示模型错误地将负例预测为正例的数量； FN（FalseNegative，假负例）：表示模型错误地将正例预测为负例的数量。这样地概念给大家一看，是不是有很多疑惑？下面我们来用大白话来说明一下这三个指标。首先，我们要关注“正确地”和“错误地”这两个形容词，分别表示看gold和pred二者一...

Wv2PRSlQRjkP 2023年11月02日 35 0 0 评价指标评价指标

torch.nn.Linear 和 torch.nn.Dropout

torch.nn.Linear  torch.nn.Linear是PyTorch中的一个线性层，它实现了一个全连接层，即输入和输出之间的每个神经元都连接到彼此。它的构造函数接受两个参数：输入特征的数量和输出特征的数量。例如，如果你想要将一个长度为100的输入向量映射到一个长度为10的输出向量，可以使用以下代码创建一个线性层： importtorch importtorch.nnasnn linear_layer=nn.Linear(100,10) 在前向传递过程中，你可以将输入张量传递给线性层，然后通过调用线性层的函数来计算输出张量。例如： input_tensor=tor...

Wv2PRSlQRjkP 2023年11月02日 87 0 0 构造函数全连接深度学习深度学习构造函数全连接

LLaMA大语言模型

大语言模型大语言模型（LargeLanguageModel，LLM）是一类强大的人工智能模型，具有出色的自然语言处理能力。它们在许多任务中表现出色，如机器翻译、文本摘要、对话生成和情感分析等。 LLM的核心原理是基于深度学习和神经网络技术，通过训练大规模的语言数据集，从中学习语言的模式和规律，并根据这些学习到的知识生成新的文本，其训练过程是一个迭代的过程，通过不断调整模型参数，使得模型能够更好地预测下一个词或句子的概率分布。举个例子，假设我们要训练一个大型语言模型来生成句子。我们会向模型输入大量的句子样本，比如：“今天天气很好。”、“我喜欢吃冰淇淋。”等等。模型会根据这些输入样本学习到词语...

Wv2PRSlQRjkP 2023年11月02日 110 0 0 llama 大语言模型大语言模型 llama

Zero Shot、One Shot、Few Shot的通俗理解

起源 ZeroShot、OneShot、FewShot技术的出现，主要是为了解决传统深度学习方法在数据不足或目标任务变化时的不足。在传统的深度学习中，需要大量的带标注样本数据来训练模型，这对于一些特定场景来说是非常困难和耗费时间的。例如，当我们面对一些新的类别或任务时，我们可能无法获得充足的带标注数据。此时，使用传统的深度学习方法可能会导致模型表现不佳。而ZeroShot、OneShot、FewShot等技术则可以更好地处理这种情况。它们通过增加先验知识、利用迁移学习等方式，在仅有极少量或没有样本数据的情况下，实现了对新类别或新任务的快速适应。这些方法可以大大缩短模型训练的时间，同时也降低...

Wv2PRSlQRjkP 2023年11月02日 60 0 0 机器学习 Zero-shot One-shot Few-shot Zero-shot Few-shot 机器学习 One-shot

深入理解LLaMA、Alpaca、ColossalChat系列模型

知乎：紫气东来 https://zhuanlan.zhihu.com/p/618695885 一、从LLaMA到Alpaca：大模型的小训练 1.1LLaMA概要与实践 LLaMA（LargeLanguageModelMetaAI）是由MetaAI发布的一款全新的大语言模型，共有7B、13B、33B、65B四种版本，其模型参数如下表所示：与原始的transformerDecoder相比，LLaMA主要有以下三点改进：预归一化（Pre-normalization）【GPT3】为了提高训练的稳定性，LLaMA对每个transformer子层的输入进行归一化，而不是对输出进行归一化。...

Wv2PRSlQRjkP 2023年11月02日 63 0 0 llama Alpaca 大语言模型大语言模型 Alpaca LLaMA ColossalChat ColossalChat

解决ValueError: Tokenizer class LLaMATokenizer does not exist or is not currently imported

LLaMA大模型是元宇宙平台公司（Meta）研发的大语言模型。问题： loadLLaMA7b的weights的时候报错： ValueError:TokenizerclassLLaMATokenizerdoesnotexistorisnotcurrentlyimported. 出现原因：新版transformers里面llama的tokenizer命名为LlamaTokenizer 但是旧的模型里面的tokenizer叫LLaMATokenizer 解决方案： 1、改动transformers源码中三个位置： utils/dummy_sentencepiece_objects.py mo...

Wv2PRSlQRjkP 2023年11月02日 76 0 0 llama 权重权重 LLaMA

huggingface optimum安装教程及其使用

huggingface HuggingFace是一个高速发展的社区，包括Meta、Google、Microsoft、Amazon在内的超过5000家组织机构在为HuggingFace开源社区贡献代码、数据集和模型。目前包括模型236,291个，数据集44,810个。刚开始大多数的模型和数据集是NLP方向的，但图像和语音的功能模型正在快速更新中。 Transformers HuggingFace出品的Transformers提供了一系列的API和工具，可以说是自然语言处理领域中当下最常用的包之一，它实现了大量的主流预训练模型架构，并提供了对应的与训练好的模型文件，使用者可以轻松下载和训练SO...

Wv2PRSlQRjkP 2023年11月02日 60 0 0 huggingface transformers ONNX transformers huggingface Optimum Optimum onnx