作者:offer拿到吐1111 xdm,这是什么狗血剧情,面试居然碰到了前女友,而且还是最后一面的面试官,真的人都麻了,这放在整个面试界也是相当的炸裂...... 真的是第一次在看面经的时候追起了故事,看着这哥们反复被虐,真的太带劲了。 事情是这样的: 跟前女友在一起快五年因为一些原因分手一年多了,期间再没联系过。昨天最后一轮hr面,邮件看到面试官跟前女友重名,心里想应该不会这么巧吧  没想到进了面试链接还真是她!!!! 兄弟们,当时的心情真的是绝了,尴尬到飞起。然后还要继续面试!!!! 开口我说了一句,好巧,没想到真是你,她一笑说别废话了来吧,自我介绍一下吧。&nb...

活久见,AI巨佬们撸起袖子线上“对喷”,一“架”直接干上热搜了。 Bigname一个接一个出现不说: 吴恩达、Hinton、LeCun、哈萨比斯……甚至吵到稳如Hinton,都开麦阴阳怪气起来: 是是是,好人力量大,我们应该把核武器也给开源了。 搞得如此面红耳赤,为的还是“大模型会不会毁灭人类”这个热点话题。 反方一派,矛头直指科技巨头搞垄断。吴恩达就言辞犀利地指出: 某些人传播(AI灭绝人类的)恐惧,只是为了搞钱。 正方这边也不甘示弱,最新消息是,被指“搞钱派”代表人物的DeepMindCEO哈萨比斯正面回怼: 这不是恐吓。AGI的风险如果不从现在就开始讨论,后果可能会很严重...

活久见,AI巨佬们撸起袖子线上“对喷”,一“架”直接干上热搜了。 Bigname一个接一个出现不说: 吴恩达、Hinton、LeCun、哈萨比斯……甚至吵到稳如Hinton,都开麦阴阳怪气起来: 是是是,好人力量大,我们应该把核武器也给开源了。 搞得如此面红耳赤,为的还是“大模型会不会毁灭人类”这个热点话题。 反方一派,矛头直指科技巨头搞垄断。吴恩达就言辞犀利地指出: 某些人传播(AI灭绝人类的)恐惧,只是为了搞钱。 正方这边也不甘示弱,最新消息是,被指“搞钱派”代表人物的DeepMindCEO哈萨比斯正面回怼: 这不是恐吓。AGI的风险如果不从现在就开始讨论,后果可能会很严重...

作者:Peter编辑:Peter 今天给大家介绍一个聚类和降维结合的项目,分为两块内容: 直接使用原数据,经过数据预处理和编码后,基于原生的K-Means和PCA/T-SNE实现用户的聚类 使用基于Transformer的预训练模型转换后的高维数据,再使用K-Means和PCA/T-SNE实现用户的聚类 本文先介绍第一种方案的完整过程。 1项目导图 整个项目的导图: 2导入库 In[1]: importpandasaspd importnumpyasnp np.random.seed(42) importmatplotlib.pyplotasplt importmatpl...

主要是了解并掌握文本定位和识别的OCR工具哦 光学字符识别是一个古老但依然具有挑战性的问题,涉及从非结构化数据中(包括图像和PDF文档)检测和识别文本。它在银行、电子商务和社交媒体内容管理等领域具有广泛的应用。 但与数据科学中的每个主题一样,尝试学习如何解决OCR任务时存在大量的资源。这就是为什么我写下这篇教程,它可以帮助您入门。 在本文中,我将展示一些Python库,可以让您轻松从图像中提取文本,无需太多麻烦。这些库的说明后面附有一个实际示例。所使用的数据集均来自Kaggle。 目录: pytesseract EasyOCR Keras-OCR TrOCR docTR 1.&nbsp...

今天我们会介绍一下10个适用于多个学科的Python数据可视化库,其中有名气很大的也有鲜为人知的 1、matplotlib 保姆级教程Matplotlib1.4W+字教程(收藏吃灰去吧) 两个直方图 matplotlib是Python可视化程序库的泰斗。经过十几年它任然是Python使用者最常用的画图库。它的设计和在1980年代被设计的商业化程序语言MATLAB非常接近。 由于matplotlib是第一个Python可视化程序库,有许多别的程序库都是建立在它的基础上或者直接调用它。 比如pandas和Seaborn就是matplotlib的外包,它们让你能用更少的代码去调用matplotli...

年初,NVIDIA的StyleGAN-T以0.1秒生成512×512分辨率图像,宣告GAN强势归来。此外,CVPR2023上朱俊彦的新作GigaGAN,证明GAN仍具有不可磨灭的优势与竞争力。 今年有关GAN的研究依旧如火如荼,产生了许多高质量的论文。我为你一口气整理了2023年210篇GAN论文,一探GAN最新研究方向,找到属于你的idea! GAN经典书籍《GenerativeDeepLearning(生成深度学习)》也在今年发布第二版。本书PDF286页,介绍了生成深度学习模型多种最前沿的架构,是今年人工智能领域必读的一本最新书! 210篇2023年GAN最新论文 2023最新发布,...

本文分享:XGBoost2.0重大更新! XGBoost是处理不同类型表格数据的最著名的算法,LightGBM和Catboost也是为了修改他的缺陷而发布的。近日XGBoost发布了新的2.0版,本文除了介绍让XGBoost的完整历史以外,还将介绍新机制和更新。 这是一篇很长的文章,因为我们首先从梯度增强决策树开始。 基于树的方法,如决策树、随机森林以及扩展后的XGBoost,在处理表格数据方面表现出色,这是因为它们的层次结构天生就善于对表格格式中常见的分层关系进行建模。它们在自动检测和整合特征之间复杂的非线性相互作用方面特别有效。另外这些算法对输入特征的规模具有健壮性,使它们能够在不...

作者:泽南、张倩 大模型看书,从来没有这么快过。 国内大模型创业公司,正在技术前沿创造新的记录。 10月30日,百川智能正式发布Baichuan2-192K长窗口大模型,将大语言模型(LLM)上下文窗口的长度一举提升到了192Ktoken。 这相当于让大模型一次处理约35万个汉字,长度达到了GPT-4(32Ktoken,约2.5万字)的14倍,Claude2.0(100Ktoken,约8万字)的4.4倍。 换句话说,Baichuan2-192K可以一次性读完一本《三体2》,是全球处理上下文窗口长度最长的大模型。此外,它也在文本生成质量、上下文理解、问答能力等多个维度的评测中显著领先对手。 ...

俗话说的好,代码写的少,离职少不了。 最近畅游互联网,发现一些离职小技巧,读后,内心被深深的打动了 但是细细的品过之后,发现对我们程序员不太适用。 例如: 领导夹菜你转桌,我们程序员一般不和领导在一桌; 领导开门你上车,咱程序员都是坐班,一般不出差,出差一般也领导开车; 领导K歌你切歌,哦KTV唱歌,我一般都躲在角落; 领导敬酒你不喝,……; 领导听牌你自摸,……; 领导喝水你刹车,…… 都是妙计,但是咱程序员不好学,然后难不倒我,我又学来了下面8条建议。 纵横职场秘籍 1.Leader说“辛苦了”,你就回“你也别闲着,帮我倒杯水”,表示对领导关怀的认可。 2.Leader微信找你,你就回“...

<<最近读物>> TMI2019|Multi-ModalKnowledgeDistillation 论文名称:MagicNet:Semi-SupervisedMulti-OrganSegmentationviaMagic-CubePartitionandRecovery 论文链接:https://openaccess.thecvf.com/content/CVPR2023/papers/Chen_MagicNet_Semi-Supervised_Multi-Organ_Segmentation_via_Magic-Cube_Partition_and_Recover...

今天给大家分享一个开源的手绘图神器:excalidraw。不管是学生还是工作人员,我们在日常的工作学习中经常要记笔记,如果有一款优秀的电子白板用来绘图或者记笔记,那将会大大提高我们的工作学习效率!之前我也一直在寻找这样的白板绘图记笔记的工具,前几天逛GitHub的时候,就发现了一款神器:Excalidraw。试用起来就两个字:好用! 一、简介 Excalidraw是一款开源的虚拟手绘风格白板,具有协作性和端到端加密功能,可在各种操作系统上使用,包括Windows、macOS、Linux,甚至移动设备。只需打开浏览器,就能够轻松绘制出精美的流程图、示意图、开发架构图等常见图形,同时还可以作为...

本文通过评估按比例扩大的NFNets,挑战了ConvNets在大规模上表现不如ViTs的观点。 深度学习的早期成功可归功于卷积神经网络(ConvNets)的发展。近十年来,ConvNets主导了计算机视觉基准测试。然而近年来,它们越来越多地被ViTs(VisionTransformers)所取代。 很多人认为,ConvNets在小型或中等规模的数据集上表现良好,但在那种比较大的网络规模的数据集上却无法与ViTs相竞争。 与此同时,CV社区已经从评估随机初始化网络在特定数据集(如ImageNet)上的性能转变为评估从网络收集的大型通用数据集上预训练的网络的性能。这就提出了一个重要的问题:在...

编辑丨极市平台 导读 scikit-learn的建模万能模板,可以根据自己的需求和数据量级选择一个合适的算法使用。 算法工程师是伴随着人工智能火起来的一个领域。听着名字似乎门槛很高。但是,得益于Python生态下的包共享机制,机器学习模型构建的过程其实已经变得非常简单了,很多听起来牛逼的算法,其实根本不需要自己实现,甚至都不需要知道这些算法的具体原理。 你只需要两步就能构建起自己的机器学习模型: 明确你需要解决的问题是什么类型,以及知道解决该类型问题所对应的算法。 从skicit-learn中调用相应的算法构建模型即可。是的!在机器学习领域,如果你只是抱着体验机器学习的心态,实现起来就是...

3D-IRCADB脏器分割数据集 数据集链接:http://m6z.cn/6x5OSn 3D-IRCADb-01数据库由10名女性和10名男性75%的肝肿瘤患者的3DCT扫描组成。20个文件夹对应20个不同的患者,可以单独下载也可以联合下载。下表提供了图像信息,例如肝脏大小(宽度、深度、高度)或根据Couninaud分割的肿瘤位置。它还表明肝脏分割软件可能遇到的主要困难是由于与邻近器官的接触、肝脏的非典型形状或密度,甚至图像中的伪影。 FASCICLE小腿肌肉超声数据集 数据集链接:http://m6z.cn/631rex FAscicle小腿肌肉超声数据集是一个由812幅小腿肌肉超声...

带了不太聪明的研究生是一种什么体验? 导师和学生果然都是相互嫌弃的啊 评论里众说纷纭,有人讲到真的有脑子不太灵光的学生,也有人讨伐题主说这个问题似乎想把某种矛盾转化为导师与学生之间的矛盾。 网友评论 @匿名用户: 坐标985,导师是青椒,副教授。 经典对话 1.导师:这个东西我记得之前和你说过了吧? 我:没有吧老师。 导师:你看啊,这个是这个意思(不得不又讲了一遍)。 2.导师:这个东西我之前告诉过你。 我:好像是,但我又忘了。 导师:你不能总忘啊,也不能让老师一遍又一遍讲。 我:我这次一定记住。 导师:鱼的记忆都比你强。 3.导师:这个东西你自己琢磨琢磨,不能有啥问题都来问老师,你是...

在完成竞赛和数据挖掘的过程中,数据分析一直是非常耗时的一个环节,但也是必要的一个环节。 能否使用一个工具代替人来完成数据分析的过程呢,现有的AutoEDA工具可以一定程度上完成上述过程。本文将盘点常见的AutoEDA工具,欢迎收藏转发。 PandasProfiling https://pandas-profiling.github.io/pandas-profiling/docs/master/index.html PandasProfiling是款比较成熟的工具,可以直接传入DataFrame即可完成分析过程,将结果展示为HTML格式,同时分析功能也比较强大。 功能:字段类型分析、变量...

作者:Sivasai,编辑:AI公园 ML工作流中最困难的部分之一是为模型找到最好的超参数。ML模型的性能与超参数直接相关。 介绍 维基百科上说,“Hyperparameteroptimization或tuning是为学习算法选择一组最优的hyperparameters的问题”。 ML工作流中最困难的部分之一是为模型找到最好的超参数。ML模型的性能与超参数直接相关。超参数调优的越好,得到的模型就越好。调优超参数可能是非常乏味和困难的,更像是一门艺术而不是科学。 超参数 超参数是在建立模型时用于控制算法行为的参数。这些参数不能从常规训练过程中获得。在对模型进行训练之前,需要对它们进行赋值...

金磊丰色 OpenAI前脚科技春晚炸翻全球,后脚自家院子却没能守住。 原因无他,就是火爆,太太太太火爆! 火爆到直接全线崩溃,无论是ChatGPT还是API,压根没法用,堪称史上最大的一次事故。 从昨天深夜开始,很多小伙伴们跟ChatGPT的对话就变成这样了: 我:出什么问题了吗? ChatGPT:嗯……确实出了些问题。 然后OpenAI官方也在事故报告中亮出了罕见的“红牌警告”: 更为罕见的是,这次还连续出了两张: CEO奥特曼也亲自下场致歉: 新功能的热度远远超出了我们的预期。 我们原本计划是在周一的时候为所有订阅者提供GPTs,但现在仍然无法实现。我们希望这个进度能加快。 由于...

网上关于各种降维算法的资料参差不齐,同时大部分不提供源代码。这里有个GitHub项目整理了使用Python实现了11种经典的数据抽取(数据降维)算法,包括:PCA、LDA、MDS、LLE、TSNE等,并附有相关资料、展示效果;非常适合机器学习初学者和刚刚入坑数据挖掘的小伙伴。 01 为什么要进行数据降维? 所谓降维,即用一组个数为d的向量Zi来代表个数为D的向量Xi所包含的有用信息,其中d<D;通俗来讲,即将高维度下降至低维度;将高维数据下降为低维数据。 通常,我们会发现大部分数据集的维度都会高达成百乃至上千,而经典的MNIST,其维度都是64。 MNIST手写数字数据集...

关注 更多

空空如也 ~ ~

粉丝 更多

空空如也 ~ ~