编辑|泽南 在盲测对比中也取得了好成绩。 最近,业内众多大模型基准又迎来了一轮“实力值”更新。 继11月初零一万物发布Yi-34B基座模型后,Yi-34B-Chat微调模型在11月24日开源上线,短时间登陆了全球多个英文、中文大模型权威榜单,再度获得了全球开发者的关注。 其中,在斯坦福大学提出的大语言模型评测基准AlpacaEval上,Yi-34B-Chat以94.08%的胜率,超越LLaMA2Chat70B、Claude2、ChatGPT,在Alpaca经认证的模型类别中,成为业内仅次于GPT-4英语能力的大语言模型,并且是经由Alpaca官方认证为数不多的开源模型。 AlpacaE...

编辑|泽南 「他们是全球最有才华的博士生。」 本周五,备受期待的英伟达奖学金公布了入选者名单。 二十多年来,英伟达研究生奖学金计划(NVIDIAGraduateFellowshipProgram)一直为研究生提供与英伟达技术相关的杰出工作支持。英伟达迄今为止已向近200名学生提供了600万美元的资助,推动了机器学习、计算机视觉、机器人和系统编程等领域的研究工作。 今年的奖学金计划向参与计算创新所有领域研究的10名博士生提供每人高达6万美元的奖学金。 英伟达奖学金面向全球学者,每年都会出现激烈的竞争,今年的候选人就超过了500名,最终入选的十人中有五位华人。 据介绍,获奖者将在奖学金年度...

作者l突围的鱼 辞退后还有必要协助前公司恢复被继任者误删的资料吗?  最近看到一个帖子,说同事被辞退,拿到80000元补偿。然后新员工拿到这个同事电脑,把资料不小心删除了。老板联系同事说是否有备份。同事表示没有,老板威胁说,不恢复资料,后果自负。老板对员工说,养了7年,还给赔偿,还要在行业曝光和封杀同事。 要是我遇到这个事……老东家待我好,那我肯定帮这个忙;老东家对我不好,要我帮忙也行,但我不是义务劳动,请先谈价格。 有人说,当初分手就分手,现在哄回来,不干。 这件事,前任已经做了交接了。是新来的操作失误造成的,很前任有什么关系?还PUA前任。 有人说,不能去,去了到时,以离...

机器学习按照模型类型分为监督学习模型、无监督学习模型两大类。 1.有监督学习 有监督学习通常是利用带有专家标注的标签的训练数据,学习一个从输入变量X到输入变量Y的函数映射。Y=f(X),训练数据通常是(n×x,y)的形式,其中n代表训练样本的大小,x和y分别是变量X和Y的样本值。 有监督学习可以被分为两类: 分类问题:预测某一样本所属的类别(离散的)。比如判断性别,是否健康等。 回归问题:预测某一样本的所对应的实数输出(连续的)。比如预测某一地区人的平均身高。 除此之外,集成学习也是一种有监督学习。它是将多个不同的相对较弱的机器学习模型的预测组合起来,用来预测新的样本。 1.1单模型 ...

 编译:机器之心   编辑:panda 正是包括两位菲尔兹奖获得者在内四位数学家的坚持,才得以证明了一个堪称「加性组合学圣杯」的猜想,其中AI辅助证明起到了不可磨灭的作用。 12月5日,著名数学家、菲尔兹奖获得者陶哲轩在社交网络宣布:对多项式Freiman-Ruzsa猜想(PFR)的证明进行形式化的Lean4项目成功完成,并且耗时仅三周时间,其依赖图的全部节点都带上了「可爱的绿色阴影」。 Lean编译器也报告该猜想符合标准公理,可以说这是计算机和AI辅助证明的一项巨大成功。 但多项式Freiman-Ruzsa猜想究竟是什么?为什么对该猜想的证明...

在本人的研究动作识别过程中,曾多次复现该领域顶级期刊的论文,有些提供了部分代码,有些则没有,提供了代码的,发现有很多过程和论文中描述的相差甚远,有一些论文和代码一致了,但是结果也和论文的不一致,请问这在您的研究生涯中是否也曾遇到过?您是如何看待的?怎样采取有效的措施,提前做出判断,不浪费更多时间在这些论文上面? 作者:韦仕才 作为一个在复现论文中踩坑无数,好不容易走出来的人,简单说一下我的看法。 例子1:我是活体检测落地的,老师当时跟我说,旷视能做出来,你应该也可以做个差不多的吧(微笑)。然后我就开始的漫长的算法复现道路。后来很久以后发现了两件事。一是腾讯的一篇论文,做了两个测试,一个是用...

刚刚过去的Ignite2023大会上,纳德拉曾宣布BingChat全线更名Copilot,并表示: Copilot无处不在。 今天,微软再次推出Copilot一系列重磅级更新。 它将集成OpenAI最新模型GPT-4Turbo、DALL-E3、以及代码解释器(CodeInterpreter)能力,并在未来几周推出。 另外,必应还开始了AI「深度搜索」功能的内测,可以把简单问题瞬间转化为详细的提示,不会prompt也不用怕了。 如此看来,你还有必要买ChatGPTPlus的会员吗?网友做了一张对比图。 Copilot年度升级,GPT-4Turbo免费用 早在今年2月,微软首次推出了直...

编辑:蒲蒲 美国时间12月6日,谷歌正式发布了Gemini大模型。按照谷歌的说法,Gemini可以像人类一样理解世界,处理代码、文字、音频、图像和视频通通不在话下。 GoogleDeepMind团队称,Gemini在32项基准性能测试中的30项上超过了GPT-4。 “我们离新一代人工智能模型的愿景越来越近了。”进行完一系列视频演示后,GoogleDeepMind产品副总裁EliCollins(伊莱·柯林斯)对包括第一财经在内的媒体说,这是Google迄今为止功能最强大、最通用的大模型。 谷歌CEOSundarPichai(桑达尔·皮查伊)评价,Gemini这一新时代的模型代表了Google...

作者:王雪儿、黄冲 编辑:学妹 “‘第一学历’是我的伤疤。” 林奇找工作时,把所有想要投递的岗位信息都列在了一张表格上,在招聘要求那一栏,一些岗位明晃晃地标注着:“各学历层次所在学校均为‘双一流’建设高校。” 这些岗位与林奇无缘。他本科就读于省内一所“双非”院校,考研那年“拼了命”,才考上位于城市另一边的“985”。林奇本以为他拿到的是“逆袭”的剧本,却在看到这些招聘要求时有点泄气,“高中不该‘混’的,到了找工作的时候才知道第一学历的重要性。”他无奈地和记者说,“感觉一步都不能踏错。” 但让林奇疑惑的是,人的发展是动态变化的,仅从“第一学历”来判断应试者的能力是否有所偏颇。“在学习...

如果你之前没用过进度条,八成是觉得它会增加不必要的复杂性或者很难维护,其实不然。要加一个进度条其实只需要几行代码。 在这几行代码中,我们可以看看如何在命令行脚本以及PySimpleGUIUI中添加进度条。 下文将介绍4个常用的Python进度条库: Progress 第一个要介绍的Python库是Progress。 你只需要定义迭代的次数、进度条类型并在每次迭代时告知进度条。 importtimefromprogress.bar importIncrementalBarmylist=[1,2,3,4,5,6,7,8] bar=IncrementalBar(Countdown,max=...

在知乎看到一个这样的问题:“为什么别选计算机专业?”  这个话题有756人关注,以及1,721,580人次浏览。以下是一位匿名用户的高赞回答,内容可能比较主观化,仅代表作者个人观点,如果有不同意见欢迎留言区交流啊! 不明白现在鼓吹计算机是什么意思。 985计算机毕业,刷LeetCode无数,背诵了无数的八股文,面试造火箭,好不容易卷进了大厂。最近开始相亲了,真的是处处碰壁啊。个人观察,女生找对象的时候,并不是看你的收入的,一个年入30万的律师,一个年入20万的医生,年入20万的公务员,年入20万的男老师,年入40万的金融男,在相亲市场上要比年入50万码农抢手的多。那些年入...

《中国人工智能系列白皮书-深度学习》是由中国人工智能学会发布的一份关于深度学习的专业报告。该白皮书旨在全面介绍深度学习技术,包括其概念、原理、应用和发展趋势等方面。 深度学习是人工智能领域的一个重要分支,它利用神经网络模型来模拟人脑的学习过程,从而实现从数据中自动提取特征、识别模式、做出决策等功能。深度学习已经在计算机视觉、语音识别、自然语言处理、推荐系统等多个领域取得了显著的成果,并且在医疗、金融、交通等行业中得到了广泛的应用。 这个白皮书提供原版pdf文件下载: 关注这个公众号,回复“深度学习白皮书”可以获取下载地址。 这个白皮书提供原版pdf文件下载: 关注这个公众号...

编辑:数据派THU 本文与你分享可应用于特征选择的各种技术的有用指南。 太多的特征会增加模型的复杂性和过拟合,而太少的特征会导致模型的拟合不足。将模型优化为足够复杂以使其性能可推广,但又足够简单易于训练、维护和解释是特征选择的主要工作。 “特征选择”意味着可以保留一些特征并放弃其他一些特征。本文的目的是概述一些特征选择策略: 删除未使用的列 删除具有缺失值的列 不相关的特征 低方差特征 多重共线性 特征系数 p值 方差膨胀因子(VIF) 基于特征重要性的特征选择 使用sci-kitlearn进行自动特征选择 主成分分析(PCA) 该演示的数据集在MIT许可下发布,来自PyCaret—...

大佬何恺明还未正式入职MIT,但和MIT的第一篇合作研究已经出来了: 他和MIT师生一起开发了一个自条件图像生成框架,名叫RCG(代码已开源)。 这个框架结构非常简单但效果拔群,直接在ImageNet-1K数据集上实现了无条件图像生成的新SOTA。 它生成的图像不需要任何人类注释(也就是提示词、类标签什么的),就能做到既保真又具有多样性。 这样的它不仅显著提高了无条件图像生成的水平,还能跟当前最好的条件生成方法一较高下。 用何恺明团队自己的话来说: 有条件和无条件生成任务之间长期存在的性能差距,终于在这一刻被弥补了。 那么,它究竟是如何做到的呢? 类似自监督学习的自条件生成 首先,所谓无...

Kaggle注册 步骤1:https://www.kaggle.com/account/login Kaggle支持两种注册,使用谷歌账号注册或邮箱注册。因为现在Kaggle被谷歌收购,推荐第一种方法,即使用谷歌账号/邮箱注册。 如果使用其他邮箱注册,建议使用稳定的邮箱,比如qq邮箱。不要用小众邮箱,邮箱关闭了你Kaggle账号的丢了。 步骤2:填写个人信息,这里需要验证码,需要网络代理(你要能上谷歌)。已经需要一个手机号码用于接收短信验证码。 Kaggle参加比赛 步骤1:https://www.kaggle.com/competitions 先登录Kaggle账号,然后找到你要参加的...

 编辑:陈萍、蛋酱 对于2023年的计算机视觉领域来说,「分割一切」(SegmentAnythingModel)是备受关注的一项研究进展。 Meta四月份发布的「分割一切模型(SAM)」效果,它能很好地自动分割图像中的所有内容 SegmentAnything的关键特征是基于提示的视觉Transformer(ViT)模型,该模型是在一个包含来自1100万张图像的超过10亿个掩码的视觉数据集SA-1B上训练的,可以分割给定图像上的任何目标。这种能力使得SAM成为视觉领域的基础模型,并在超出视觉之外的领域也能产生应用价值。 尽管有上述优点,但由于SAM中的ViT-H图像编码器有63...

如果没有正确的工具帮助,PythonDebug真的会使人崩溃。今天云朵君将和大家一起学习8种不同的Debug工具帮助我们轻松调试Python代码。 由于没有办法检测和解决你的代码bug,Debug的步骤很快就会变得令人沮丧。值得庆幸的是,现在有很多工具可以帮助我们严格而详细地调试你的Python代码。 由于没有办法检测和解决你的代码bug,调试的步骤很快就会变得令人沮丧。Python有一些基本函数可以帮助调试(见下面的print()过程)。尽管如此,你可能仍然需要第三方工具来帮助你提高调试技能。 下面是我们列出的调试Python的最佳工具。(其中前两个我们在这里已经介绍过) Sentry一...

FAIR又一位大佬级研究科学家「出走了」,这次是R-CNN作者RossGirshick。 近日,Meta首席科学家YannLeCun发推宣布,RossGirshick将离开FAIR,加入艾伦人工智能研究所(AI2)。此前离职的还有 ResNeXt一作谢赛宁(加入纽约大学任助理教授)、GeorgiaGkioxari(加入Caltech任助理教授)等。 图源:https://twitter.com/ylecun/status/1730713022195470541 我们查了一下RossGirshick的个人主页,证实了他从FAIR离职的消息。他将于2024年初入职AI2。 AI2的计...

作者|FareedKhan  翻译| 赵鉴开,校对:赵茹萱 transformer架构可能看起来很恐怖,您也可能在YouTube或博客中看到了各种解释。但是,在我的博客中,我将通过提供一个全面的数学示例阐明它的原理。通过这样做,我希望简化对transformer架构的理解。 那就开始吧! InputsandPositionalEncoding 让我们解决最初的部分,在那里我们将确定我们的输入并计算它们的位置编码。 Step1(Definingthedata) 第一步是定义我们的数据集 (语料库)。 在我们的数据集中,有3个句子 (对话)...

作者丨VardanAgarwal、ronghuaiyang(译)编辑丨极市平台 导读 本文介绍了一种高效的网络模型EfficientNet,并分析了 EfficientNetB0至B7的网络结构之间的差异。 我在一个Kaggle竞赛中翻阅notebooks,发现几乎每个人都在使用EfficientNet作为他们的主干,而我之前从未听说过这个。 谷歌AI在这篇文章中:https://arxiv.org/abs/1905.11946介绍了它,他们试图提出一种更高效的方法,就像它的名字所建议的那样,同时改善了最新的结果。一般来说,模型设计得太宽,太深,或者分辨率太高。刚开始的时候,...

关注 更多

空空如也 ~ ~

粉丝 更多

空空如也 ~ ~