摩杜云开发者社区-摩杜云

零一万物Yi-34B-Chat微调模型上线，登陆多个权威榜单

编辑|泽南在盲测对比中也取得了好成绩。最近，业内众多大模型基准又迎来了一轮“实力值”更新。继11月初零一万物发布Yi-34B基座模型后，Yi-34B-Chat微调模型在11月24日开源上线，短时间登陆了全球多个英文、中文大模型权威榜单，再度获得了全球开发者的关注。其中，在斯坦福大学提出的大语言模型评测基准AlpacaEval上，Yi-34B-Chat以94.08%的胜率，超越LLaMA2Chat70B、Claude2、ChatGPT，在Alpaca经认证的模型类别中，成为业内仅次于GPT-4英语能力的大语言模型，并且是经由Alpaca官方认证为数不多的开源模型。 AlpacaE...

BhYoICNPeXOn 2023年12月23日 13 0 0 开发者数据数据开发者机器学习机器学习

人均6万美元：2024英伟达奖学金名单公布，五位华人入选

编辑|泽南「他们是全球最有才华的博士生。」本周五，备受期待的英伟达奖学金公布了入选者名单。二十多年来，英伟达研究生奖学金计划（NVIDIAGraduateFellowshipProgram）一直为研究生提供与英伟达技术相关的杰出工作支持。英伟达迄今为止已向近200名学生提供了600万美元的资助，推动了机器学习、计算机视觉、机器人和系统编程等领域的研究工作。今年的奖学金计划向参与计算创新所有领域研究的10名博士生提供每人高达6万美元的奖学金。英伟达奖学金面向全球学者，每年都会出现激烈的竞争，今年的候选人就超过了500名，最终入选的十人中有五位华人。据介绍，获奖者将在奖学金年度...

BhYoICNPeXOn 2023年12月23日 53 0 0 英伟达英伟达微信机器学习机器学习微信

辞退员工赔偿 8W，公司三天后急忙联系该员工帮忙找回被误删的文件，果断拒绝！...

作者l突围的鱼辞退后还有必要协助前公司恢复被继任者误删的资料吗？  最近看到一个帖子，说同事被辞退，拿到80000元补偿。然后新员工拿到这个同事电脑，把资料不小心删除了。老板联系同事说是否有备份。同事表示没有，老板威胁说，不恢复资料，后果自负。老板对员工说，养了7年，还给赔偿，还要在行业曝光和封杀同事。要是我遇到这个事……老东家待我好，那我肯定帮这个忙；老东家对我不好，要我帮忙也行，但我不是义务劳动，请先谈价格。有人说，当初分手就分手，现在哄回来，不干。这件事，前任已经做了交接了。是新来的操作失误造成的，很前任有什么关系？还PUA前任。有人说，不能去，去了到时，以离...

BhYoICNPeXOn 2023年12月23日 63 0 0 微信误删机器学习微信误删机器学习

【机器学习】机器学习基础知识点全面总结！

机器学习按照模型类型分为监督学习模型、无监督学习模型两大类。 1.有监督学习有监督学习通常是利用带有专家标注的标签的训练数据，学习一个从输入变量X到输入变量Y的函数映射。Y=f(X)，训练数据通常是(n×x,y)的形式，其中n代表训练样本的大小，x和y分别是变量X和Y的样本值。有监督学习可以被分为两类：分类问题：预测某一样本所属的类别（离散的）。比如判断性别，是否健康等。回归问题：预测某一样本的所对应的实数输出（连续的）。比如预测某一地区人的平均身高。除此之外，集成学习也是一种有监督学习。它是将多个不同的相对较弱的机器学习模型的预测组合起来，用来预测新的样本。 1.1单模型 ...

BhYoICNPeXOn 2023年12月23日 88 0 0 数据数据聚类人工智能机器学习人工智能聚类机器学习

陶哲轩用 AI 形式化的证明究竟是什么？一文看懂 PFR 猜想的前世今生

 编译：机器之心   编辑：panda 正是包括两位菲尔兹奖获得者在内四位数学家的坚持，才得以证明了一个堪称「加性组合学圣杯」的猜想，其中AI辅助证明起到了不可磨灭的作用。 12月5日，著名数学家、菲尔兹奖获得者陶哲轩在社交网络宣布：对多项式Freiman-Ruzsa猜想（PFR）的证明进行形式化的Lean4项目成功完成，并且耗时仅三周时间，其依赖图的全部节点都带上了「可爱的绿色阴影」。 Lean编译器也报告该猜想符合标准公理，可以说这是计算机和AI辅助证明的一项巨大成功。但多项式Freiman-Ruzsa猜想究竟是什么？为什么对该猜想的证明...

BhYoICNPeXOn 2023年12月23日 40 0 0 计算机科学组合学人工智能人工智能计算机科学多项式多项式组合学

【深度学习】如何评价深度学习相关顶级期刊论文难复现的问题？

在本人的研究动作识别过程中，曾多次复现该领域顶级期刊的论文，有些提供了部分代码，有些则没有，提供了代码的，发现有很多过程和论文中描述的相差甚远，有一些论文和代码一致了，但是结果也和论文的不一致，请问这在您的研究生涯中是否也曾遇到过？您是如何看待的？怎样采取有效的措施，提前做出判断，不浪费更多时间在这些论文上面？作者：韦仕才作为一个在复现论文中踩坑无数，好不容易走出来的人，简单说一下我的看法。例子1：我是活体检测落地的，老师当时跟我说，旷视能做出来，你应该也可以做个差不多的吧（微笑）。然后我就开始的漫长的算法复现道路。后来很久以后发现了两件事。一是腾讯的一篇论文，做了两个测试，一个是用...

BhYoICNPeXOn 2023年12月23日 81 0 0 数据深度学习数据数据集数据集人工智能人工智能深度学习

微软Copilot史诗级更新！GPT-4 Turbo免费用，必应深度搜索30秒精准解答

刚刚过去的Ignite2023大会上，纳德拉曾宣布BingChat全线更名Copilot，并表示： Copilot无处不在。今天，微软再次推出Copilot一系列重磅级更新。它将集成OpenAI最新模型GPT-4Turbo、DALL-E3、以及代码解释器（CodeInterpreter）能力，并在未来几周推出。另外，必应还开始了AI「深度搜索」功能的内测，可以把简单问题瞬间转化为详细的提示，不会prompt也不用怕了。如此看来，你还有必要买ChatGPTPlus的会员吗？网友做了一张对比图。 Copilot年度升级，GPT-4Turbo免费用早在今年2月，微软首次推出了直...

BhYoICNPeXOn 2023年12月23日 61 0 0 搜索必应深度搜索 microsoft microsoft 必应 copilot 深度搜索 copilot 搜索

谷歌 Gemini 与 GPT-4 哪家强？

编辑：蒲蒲美国时间12月6日，谷歌正式发布了Gemini大模型。按照谷歌的说法，Gemini可以像人类一样理解世界，处理代码、文字、音频、图像和视频通通不在话下。 GoogleDeepMind团队称，Gemini在32项基准性能测试中的30项上超过了GPT-4。 “我们离新一代人工智能模型的愿景越来越近了。”进行完一系列视频演示后，GoogleDeepMind产品副总裁EliCollins（伊莱·柯林斯）对包括第一财经在内的媒体说，这是Google迄今为止功能最强大、最通用的大模型。谷歌CEOSundarPichai(桑达尔·皮查伊)评价，Gemini这一新时代的模型代表了Google...

BhYoICNPeXOn 2023年12月23日 58 0 0 Google Google 模态基准测试模态基准测试

【学术相关】困在“第一学历”的年轻人

作者：王雪儿、黄冲 编辑：学妹 “‘第一学历’是我的伤疤。” 林奇找工作时，把所有想要投递的岗位信息都列在了一张表格上，在招聘要求那一栏，一些岗位明晃晃地标注着：“各学历层次所在学校均为‘双一流’建设高校。” 这些岗位与林奇无缘。他本科就读于省内一所“双非”院校，考研那年“拼了命”，才考上位于城市另一边的“985”。林奇本以为他拿到的是“逆袭”的剧本，却在看到这些招聘要求时有点泄气，“高中不该‘混’的，到了找工作的时候才知道第一学历的重要性。”他无奈地和记者说，“感觉一步都不能踏错。” 但让林奇疑惑的是，人的发展是动态变化的，仅从“第一学历”来判断应试者的能力是否有所偏颇。“在学习...

BhYoICNPeXOn 2023年12月23日 33 0 0 微信机器学习技术类技术类微信机器学习

【Python】Python制作进度条，原来有这么多方法

如果你之前没用过进度条，八成是觉得它会增加不必要的复杂性或者很难维护，其实不然。要加一个进度条其实只需要几行代码。在这几行代码中，我们可以看看如何在命令行脚本以及PySimpleGUIUI中添加进度条。下文将介绍4个常用的Python进度条库： Progress 第一个要介绍的Python库是Progress。你只需要定义迭代的次数、进度条类型并在每次迭代时告知进度条。 importtimefromprogress.bar importIncrementalBarmylist=[1,2,3,4,5,6,7,8] bar=IncrementalBar(Countdown,max=...

BhYoICNPeXOn 2023年12月22日 20 0 0 python 开发语言开发语言机器学习进度条进度条机器学习 Python

知乎高赞：为什么别选计算机专业？

在知乎看到一个这样的问题：“为什么别选计算机专业？”  这个话题有756人关注，以及1,721,580人次浏览。以下是一位匿名用户的高赞回答，内容可能比较主观化，仅代表作者个人观点，如果有不同意见欢迎留言区交流啊！不明白现在鼓吹计算机是什么意思。 985计算机毕业，刷LeetCode无数，背诵了无数的八股文，面试造火箭，好不容易卷进了大厂。最近开始相亲了，真的是处处碰壁啊。个人观察，女生找对象的时候，并不是看你的收入的，一个年入30万的律师，一个年入20万的医生，年入20万的公务员，年入20万的男老师，年入40万的金融男，在相亲市场上要比年入50万码农抢手的多。那些年入...

BhYoICNPeXOn 2023年12月22日 59 0 0 码农码农知乎机器学习机器学习知乎

2023中国人工智能系列白皮书-深度学习(附下载)

《中国人工智能系列白皮书-深度学习》是由中国人工智能学会发布的一份关于深度学习的专业报告。该白皮书旨在全面介绍深度学习技术，包括其概念、原理、应用和发展趋势等方面。深度学习是人工智能领域的一个重要分支，它利用神经网络模型来模拟人脑的学习过程，从而实现从数据中自动提取特征、识别模式、做出决策等功能。深度学习已经在计算机视觉、语音识别、自然语言处理、推荐系统等多个领域取得了显著的成果，并且在医疗、金融、交通等行业中得到了广泛的应用。这个白皮书提供原版pdf文件下载：关注这个公众号，回复“深度学习白皮书”可以获取下载地址。这个白皮书提供原版pdf文件下载：关注这个公众号...

BhYoICNPeXOn 2023年12月22日 17 0 0 人工智能人工智能深度学习深度学习公众号公众号

【机器学习】11 种特征选择策略总结！

编辑：数据派THU 本文与你分享可应用于特征选择的各种技术的有用指南。太多的特征会增加模型的复杂性和过拟合，而太少的特征会导致模型的拟合不足。将模型优化为足够复杂以使其性能可推广，但又足够简单易于训练、维护和解释是特征选择的主要工作。 “特征选择”意味着可以保留一些特征并放弃其他一些特征。本文的目的是概述一些特征选择策略：删除未使用的列删除具有缺失值的列不相关的特征低方差特征多重共线性特征系数 p值方差膨胀因子(VIF) 基于特征重要性的特征选择使用sci-kitlearn进行自动特征选择主成分分析(PCA) 该演示的数据集在MIT许可下发布，来自PyCaret—...

BhYoICNPeXOn 2023年12月22日 36 0 0 特征选择特征选择人工智能人工智能机器学习机器学习 ci 方差 ci 方差

【深度学习】何恺明新作：简单框架达成无条件图像生成新SOTA！与MIT合作完成...

大佬何恺明还未正式入职MIT，但和MIT的第一篇合作研究已经出来了：他和MIT师生一起开发了一个自条件图像生成框架，名叫RCG（代码已开源）。这个框架结构非常简单但效果拔群，直接在ImageNet-1K数据集上实现了无条件图像生成的新SOTA。它生成的图像不需要任何人类注释（也就是提示词、类标签什么的），就能做到既保真又具有多样性。这样的它不仅显著提高了无条件图像生成的水平，还能跟当前最好的条件生成方法一较高下。用何恺明团队自己的话来说：有条件和无条件生成任务之间长期存在的性能差距，终于在这一刻被弥补了。那么，它究竟是如何做到的呢？类似自监督学习的自条件生成首先，所谓无...

BhYoICNPeXOn 2023年12月22日 43 0 0 微信人工智能微信人工智能深度学习机器学习机器学习深度学习监督学习监督学习

Kaggle操作完整指南（2023版）

Kaggle注册步骤1：https://www.kaggle.com/account/login Kaggle支持两种注册，使用谷歌账号注册或邮箱注册。因为现在Kaggle被谷歌收购，推荐第一种方法，即使用谷歌账号/邮箱注册。如果使用其他邮箱注册，建议使用稳定的邮箱，比如qq邮箱。不要用小众邮箱，邮箱关闭了你Kaggle账号的丢了。步骤2：填写个人信息，这里需要验证码，需要网络代理（你要能上谷歌）。已经需要一个手机号码用于接收短信验证码。 Kaggle参加比赛步骤1：https://www.kaggle.com/competitions 先登录Kaggle账号，然后找到你要参加的...

BhYoICNPeXOn 2023年12月22日 60 0 0 开发语言人工智能开发语言数据集加载数据集加载 python Python 人工智能

【深度学习】小模型也可以「分割一切」，Meta改进SAM，参数仅为原版5%

 编辑：陈萍、蛋酱对于2023年的计算机视觉领域来说，「分割一切」（SegmentAnythingModel）是备受关注的一项研究进展。 Meta四月份发布的「分割一切模型（SAM）」效果，它能很好地自动分割图像中的所有内容 SegmentAnything的关键特征是基于提示的视觉Transformer（ViT）模型，该模型是在一个包含来自1100万张图像的超过10亿个掩码的视觉数据集SA-1B上训练的，可以分割给定图像上的任何目标。这种能力使得SAM成为视觉领域的基础模型，并在超出视觉之外的领域也能产生应用价值。尽管有上述优点，但由于SAM中的ViT-H图像编码器有63...

BhYoICNPeXOn 2023年12月22日 67 0 0 基线基线编码器人工智能深度学习编码器 ci ci 深度学习人工智能

【Python】起飞！又来 8 种 Python Debug 工具

如果没有正确的工具帮助，PythonDebug真的会使人崩溃。今天云朵君将和大家一起学习8种不同的Debug工具帮助我们轻松调试Python代码。由于没有办法检测和解决你的代码bug，Debug的步骤很快就会变得令人沮丧。值得庆幸的是，现在有很多工具可以帮助我们严格而详细地调试你的Python代码。由于没有办法检测和解决你的代码bug，调试的步骤很快就会变得令人沮丧。Python有一些基本函数可以帮助调试(见下面的print()过程)。尽管如此，你可能仍然需要第三方工具来帮助你提高调试技能。下面是我们列出的调试Python的最佳工具。（其中前两个我们在这里已经介绍过） Sentry一...

BhYoICNPeXOn 2023年12月19日 14 0 0 调试工具开发语言解决方案 python python 开发语言调试工具解决方案

R-CNN作者Ross Girshick离职，何恺明、谢赛宁回归学界，Meta CV走出了多少大神

FAIR又一位大佬级研究科学家「出走了」，这次是R-CNN作者RossGirshick。近日，Meta首席科学家YannLeCun发推宣布，RossGirshick将离开FAIR，加入艾伦人工智能研究所（AI2）。此前离职的还有 ResNeXt一作谢赛宁（加入纽约大学任助理教授）、GeorgiaGkioxari（加入Caltech任助理教授）等。图源：https://twitter.com/ylecun/status/1730713022195470541 我们查了一下RossGirshick的个人主页，证实了他从FAIR离职的消息。他将于2024年初入职AI2。 AI2的计...

BhYoICNPeXOn 2023年12月19日 10 0 0 神经网络神经网络开发语言 cnn 人工智能 r语言开发语言 cnn r语言人工智能

【深度学习】图解！逐步理解Transformers的数学原理

作者|FareedKhan  翻译| 赵鉴开，校对：赵茹萱 transformer架构可能看起来很恐怖，您也可能在YouTube或博客中看到了各种解释。但是，在我的博客中，我将通过提供一个全面的数学示例阐明它的原理。通过这样做，我希望简化对transformer架构的理解。那就开始吧！ InputsandPositionalEncoding 让我们解决最初的部分，在那里我们将确定我们的输入并计算它们的位置编码。 Step1(Definingthedata) 第一步是定义我们的数据集 (语料库)。在我们的数据集中，有3个句子 (对话)...

BhYoICNPeXOn 2023年12月19日 28 0 0 数据集权重人工智能机器学习机器学习深度学习深度学习权重数据集人工智能

【深度学习】一文读懂EfficientNet

作者丨VardanAgarwal、ronghuaiyang（译）编辑丨极市平台导读本文介绍了一种高效的网络模型EfficientNet，并分析了 EfficientNetB0至B7的网络结构之间的差异。我在一个Kaggle竞赛中翻阅notebooks，发现几乎每个人都在使用EfficientNet作为他们的主干，而我之前从未听说过这个。谷歌AI在这篇文章中：https://arxiv.org/abs/1905.11946介绍了它，他们试图提出一种更高效的方法，就像它的名字所建议的那样，同时改善了最新的结果。一般来说，模型设计得太宽，太深，或者分辨率太高。刚开始的时候，...

BhYoICNPeXOn 2023年12月19日 49 0 0 ci 人工智能微信机器学习机器学习深度学习深度学习 ci 微信人工智能