摩杜云开发者社区-摩杜云

通过ORPO技术微调 llama3大模型(Fine-tune Llama 3 with ORPO)

1f45bd1e8577af66a05f5e3fadb0b29 通过ORPO对llama进行微调前言 ORPO是一种新颖的微调技术，它将传统的监督微调和偏好对齐阶段整合到一个过程中。这减少了训练所需的计算资源和时间。此外，经验结果表明，ORPO在各种模型大小和基准测试中都超过了其他对齐方法。在本文中，我们将使用ORPO和TRL库来微调新的Llama38B模型。代码可以在GoogleColab（https://colab.research.google.com/drive/1eHNWg9gnaXErdAa8_mcvjMupbSS6rDvi?usp=sharing）和GitHub上的LLM(ht...

p3KwAFlRikPF 17天前 21 0 0 大模型

使用ollama分别在我的window、mac、小米手机上部署体验llama3-8b

1、ollama到底是个什么玩意一句话来说，Ollama是一个基于Go语言开发的简单易用的本地大模型运行框架。可以将其类比为docker（有类似docker中的一些常规命令list,pull,push,run等等），事实上确实也制定了类似docker的一种模型应用标准，在后边的内容中，你能更加真切体会到这一点。在管理模型的同时，它还基于Go语言中的Web框架gin提供了一些Api接口，让你能够像跟OpenAI提供的接口那样进行交互。 2、来看看ollama的几个命令 ollama安装之后，其同时还是一个命令，与模型交互就是通过命令来进行的。 ollamalist：显示模型列表 ollam...

p3KwAFlRikPF 18天前 32 0 0 大模型

开源.NET8.0小项目伪微服务框架（分布式、EFCore、Redis、RabbitMQ、Mysql等）

1、前言为什么说是伪微服务框架，常见微服务框架可能还包括服务容错、服务间的通信、服务追踪和监控、服务注册和发现等等，而我这里为了在使用中的更简单，将很多东西进行了简化或者省略了。年前到现在在开发一个新的小项目，刚好项目最初的很多功能是比较通用的，所以就想着将这些功能抽离出来，然后做成一个通用的基础服务，然后其他项目可以直接引用这个基础服务，这样就可以减少很多重复的工作了。我在做的过程中也是参考了公司原有的一个项目，目标是尽量的简单，但是项目搞着搞着就越来越大了，所以我也是在不断的进行简化和优化。当然我的思考和架构能力还存在很大的问题，另外还由于时间比较仓促，很多东西还没有经过我的深思熟虑，...

p3KwAFlRikPF 2024年03月07日 63 0 0 .NET