英文名称:Llama2:OpenFoundationandFine-TunedChatModels中文名称:Llama2:开源的基础模型和微调的聊天模型文章:http://arxiv.org/abs/2307.09288代码:https://github.com/facebookresearch/llama作者:HugoTouvron日期:2023-07-19引用次数:110 1读后感 这是一篇77页的论文,正文也有36页,让人望而却步。整体分成:Introduction,Pretraining,Fine-tune,Safety,Discussion,RelateWork,Conclusio...

  Uvf2FDdXrKkq   2023年11月02日   52   0   0 论文阅读迭代数据强化学习

1推荐主题 butterfly的默认layout很好,尤其对于内容比较多的blog,安装方法如下: npminstallhexo-renderer-pughexo-renderer-stylus--save npminstallhexo-theme-butterfly cpnode_modules/hexo-theme-butterfly/_config.yml_config.butterfly.yml vi_config.yml修改theme:butterfly 2正常显示Latex公式 2.1切换渲染器 切成root权限,安装pandoc: apkaddpandoc 2.2安装插...

英文名称:ToolLLM:FacilitatingLargeLanguageModelstoMaster16000+Real-worldAPIs中文名称:TOOLLLM:帮助大语言模型掌握16000多个真实世界的API文章:http://arxiv.org/abs/2307.16789代码:https://github.com/OpenBMB/ToolBench作者:YujiaQin日期:2023-07-31 1读后感 论文致力于让大模型学习使用工具,以实现复杂的任务。目前使用工具能力最强的还是ChatGPT,但不清楚它是如何实现的。文中提出的ToolLLM主要用于构建针对引导调优(inst...

  Uvf2FDdXrKkq   2023年11月02日   36   0   0 论文阅读数据调优API

英文名称:DenoisingDiffusionProbabilisticModels中文名称:去噪扩散概率模型论文地址:http://arxiv.org/abs/2006.11239代码地址1:https://github.com/hojonathanho/diffusion(论文对应代码tensorflow)代码地址2:https://github.com/AUTOMATIC1111/stable-diffusion-webuistable-diffusion-webui/modules/models/diffusion/ddpm_edit.py(推荐pytorch)时间:2020-12-...

  Uvf2FDdXrKkq   2023年11月02日   32   0   0 论文阅读神经网络去噪方差

英文名称:DeepUnsupervisedLearningusingNonequilibriumThermodynamics中文名称:使用非平衡热力学原理的深度无监督学习论文地址:http://arxiv.org/abs/1503.03585代码地址:https://github.com/Sohl-Dickstein/Diffusion-Probabilistic-Models时间:2015-11-18作者:JaschaSohl-Dickstein,斯坦福大学引用量:1813 读后感 论文目标是建立灵活且易用的数据生成模型。它利用非平衡统计物理学原理:通过扩散过程(少量加噪)系统地、缓慢地破...

关注 更多

空空如也 ~ ~

粉丝 更多

空空如也 ~ ~