摩杜云开发者社区-摩杜云

面试官是自己前女友，全程被拷问~

作者：offer拿到吐1111 xdm，这是什么狗血剧情，面试居然碰到了前女友，而且还是最后一面的面试官，真的人都麻了，这放在整个面试界也是相当的炸裂...... 真的是第一次在看面经的时候追起了故事，看着这哥们反复被虐，真的太带劲了。事情是这样的：跟前女友在一起快五年因为一些原因分手一年多了，期间再没联系过。昨天最后一轮hr面，邮件看到面试官跟前女友重名，心里想应该不会这么巧吧  没想到进了面试链接还真是她！！！！兄弟们，当时的心情真的是绝了，尴尬到飞起。然后还要继续面试！！！！开口我说了一句，好巧，没想到真是你，她一笑说别废话了来吧，自我介绍一下吧。&nb...

BhYoICNPeXOn 2023年12月06日 30 0 0 机器学习微信机器学习发邮件发邮件微信

活久见！AI巨佬为“人类灭绝论”正面开撕，Hinton吴恩达LeCun下场，马斯克强势围观...

活久见，AI巨佬们撸起袖子线上“对喷”，一“架”直接干上热搜了。 Bigname一个接一个出现不说：吴恩达、Hinton、LeCun、哈萨比斯……甚至吵到稳如Hinton，都开麦阴阳怪气起来：是是是，好人力量大，我们应该把核武器也给开源了。搞得如此面红耳赤，为的还是“大模型会不会毁灭人类”这个热点话题。反方一派，矛头直指科技巨头搞垄断。吴恩达就言辞犀利地指出：某些人传播（AI灭绝人类的）恐惧，只是为了搞钱。正方这边也不甘示弱，最新消息是，被指“搞钱派”代表人物的DeepMindCEO哈萨比斯正面回怼：这不是恐吓。AGI的风险如果不从现在就开始讨论，后果可能会很严重...

BhYoICNPeXOn 2023年12月06日 21 0 0 深度学习人工智能机器学习人工智能深度学习机器学习

活久见！AI巨佬为“人类灭绝论”正面开撕，Hinton吴恩达LeCun下场，马斯克强势围观...

活久见，AI巨佬们撸起袖子线上“对喷”，一“架”直接干上热搜了。 Bigname一个接一个出现不说：吴恩达、Hinton、LeCun、哈萨比斯……甚至吵到稳如Hinton，都开麦阴阳怪气起来：是是是，好人力量大，我们应该把核武器也给开源了。搞得如此面红耳赤，为的还是“大模型会不会毁灭人类”这个热点话题。反方一派，矛头直指科技巨头搞垄断。吴恩达就言辞犀利地指出：某些人传播（AI灭绝人类的）恐惧，只是为了搞钱。正方这边也不甘示弱，最新消息是，被指“搞钱派”代表人物的DeepMindCEO哈萨比斯正面回怼：这不是恐吓。AGI的风险如果不从现在就开始讨论，后果可能会很严重...

BhYoICNPeXOn 2023年12月06日 29 0 0 人工智能深度学习机器学习深度学习机器学习人工智能

【机器学习】用户分群：聚类和降维完美结合！

作者：Peter编辑：Peter 今天给大家介绍一个聚类和降维结合的项目，分为两块内容：直接使用原数据，经过数据预处理和编码后，基于原生的K-Means和PCA/T-SNE实现用户的聚类使用基于Transformer的预训练模型转换后的高维数据，再使用K-Means和PCA/T-SNE实现用户的聚类本文先介绍第一种方案的完整过程。 1项目导图整个项目的导图： 2导入库 In[1]: importpandasaspd importnumpyasnp np.random.seed(42) importmatplotlib.pyplotasplt importmatpl...

BhYoICNPeXOn 2023年12月06日 32 0 0 算法算法人工智能人工智能机器学习机器学习数据挖掘数据挖掘聚类聚类

可以提取图像文本的 5 大 Python 库

主要是了解并掌握文本定位和识别的OCR工具哦光学字符识别是一个古老但依然具有挑战性的问题，涉及从非结构化数据中（包括图像和PDF文档）检测和识别文本。它在银行、电子商务和社交媒体内容管理等领域具有广泛的应用。但与数据科学中的每个主题一样，尝试学习如何解决OCR任务时存在大量的资源。这就是为什么我写下这篇教程，它可以帮助您入门。在本文中，我将展示一些Python库，可以让您轻松从图像中提取文本，无需太多麻烦。这些库的说明后面附有一个实际示例。所使用的数据集均来自Kaggle。目录： pytesseract EasyOCR Keras-OCR TrOCR docTR 1.&nbsp...

BhYoICNPeXOn 2023年12月02日 34 0 0 开发语言 Image 开发语言 python Image python

【Python】十大保姆级Python可视化绘制工具推荐~~

今天我们会介绍一下10个适用于多个学科的Python数据可视化库，其中有名气很大的也有鲜为人知的 1、matplotlib 保姆级教程Matplotlib1.4W+字教程（收藏吃灰去吧）两个直方图 matplotlib是Python可视化程序库的泰斗。经过十几年它任然是Python使用者最常用的画图库。它的设计和在1980年代被设计的商业化程序语言MATLAB非常接近。由于matplotlib是第一个Python可视化程序库，有许多别的程序库都是建立在它的基础上或者直接调用它。比如pandas和Seaborn就是matplotlib的外包，它们让你能用更少的代码去调用matplotli...

BhYoICNPeXOn 2023年12月02日 22 0 0 开发者开发语言开发语言开发者数据 python 数据 python

【深度学习】GAN强势归来！210篇论文总结GAN最新研究

年初，NVIDIA的StyleGAN-T以0.1秒生成512×512分辨率图像，宣告GAN强势归来。此外，CVPR2023上朱俊彦的新作GigaGAN，证明GAN仍具有不可磨灭的优势与竞争力。今年有关GAN的研究依旧如火如荼，产生了许多高质量的论文。我为你一口气整理了2023年210篇GAN论文，一探GAN最新研究方向，找到属于你的idea！ GAN经典书籍《GenerativeDeepLearning(生成深度学习)》也在今年发布第二版。本书PDF286页，介绍了生成深度学习模型多种最前沿的架构，是今年人工智能领域必读的一本最新书！ 210篇2023年GAN最新论文 2023最新发布，...

BhYoICNPeXOn 2023年12月02日 46 0 0 神经网络神经网络人工智能生成对抗网络生成对抗网络机器学习机器学习深度学习深度学习人工智能

【机器学习】详解XGBoost 2.0重大更新！

本文分享：XGBoost2.0重大更新！ XGBoost是处理不同类型表格数据的最著名的算法，LightGBM和Catboost也是为了修改他的缺陷而发布的。近日XGBoost发布了新的2.0版，本文除了介绍让XGBoost的完整历史以外，还将介绍新机制和更新。这是一篇很长的文章，因为我们首先从梯度增强决策树开始。基于树的方法，如决策树、随机森林以及扩展后的XGBoost，在处理表格数据方面表现出色，这是因为它们的层次结构天生就善于对表格格式中常见的分层关系进行建模。它们在自动检测和整合特征之间复杂的非线性相互作用方面特别有效。另外这些算法对输入特征的规模具有健壮性，使它们能够在不...

BhYoICNPeXOn 2023年12月02日 59 0 0 数据决策树人工智能数据决策树机器学习人工智能随机森林随机森林机器学习

【NLP】全球最强长文本大模型，一次可读35万汉字：Baichuan2-192K上线

作者：泽南、张倩大模型看书，从来没有这么快过。国内大模型创业公司，正在技术前沿创造新的记录。 10月30日，百川智能正式发布Baichuan2-192K长窗口大模型，将大语言模型（LLM）上下文窗口的长度一举提升到了192Ktoken。这相当于让大模型一次处理约35万个汉字，长度达到了GPT-4（32Ktoken，约2.5万字）的14倍，Claude2.0（100Ktoken，约8万字）的4.4倍。换句话说，Baichuan2-192K可以一次性读完一本《三体2》，是全球处理上下文窗口长度最长的大模型。此外，它也在文本生成质量、上下文理解、问答能力等多个维度的评测中显著领先对手。 ...

BhYoICNPeXOn 2023年12月02日 64 0 0 API 自然语言处理人工智能机器学习人工智能自然语言处理 API 机器学习

代码是上午写的，人是下午被开除的

俗话说的好，代码写的少，离职少不了。最近畅游互联网，发现一些离职小技巧，读后，内心被深深的打动了但是细细的品过之后，发现对我们程序员不太适用。例如：领导夹菜你转桌，我们程序员一般不和领导在一桌；领导开门你上车，咱程序员都是坐班，一般不出差，出差一般也领导开车；领导K歌你切歌，哦KTV唱歌，我一般都躲在角落；领导敬酒你不喝，……；领导听牌你自摸，……；领导喝水你刹车，…… 都是妙计，但是咱程序员不好学，然后难不倒我，我又学来了下面8条建议。纵横职场秘籍 1.Leader说“辛苦了”，你就回“你也别闲着，帮我倒杯水”，表示对领导关怀的认可。 2.Leader微信找你，你就回“...

BhYoICNPeXOn 2023年12月02日 79 0 0 字段字段微信机器学习机器学习微信

【深度学习】MagicNet | CVPR2022 | 医学图像的3D mixer

<<最近读物>> TMI2019|Multi-ModalKnowledgeDistillation 论文名称：MagicNet:Semi-SupervisedMulti-OrganSegmentationviaMagic-CubePartitionandRecovery 论文链接：https://openaccess.thecvf.com/content/CVPR2023/papers/Chen_MagicNet_Semi-Supervised_Multi-Organ_Segmentation_via_Magic-Cube_Partition_and_Recover...

BhYoICNPeXOn 2023年12月02日 37 0 0 sed 人工智能数据数据机器学习机器学习深度学习深度学习 sed 人工智能

效率提升 100%，一款效果炸裂的白板神器！

今天给大家分享一个开源的手绘图神器：excalidraw。不管是学生还是工作人员，我们在日常的工作学习中经常要记笔记，如果有一款优秀的电子白板用来绘图或者记笔记，那将会大大提高我们的工作学习效率！之前我也一直在寻找这样的白板绘图记笔记的工具，前几天逛GitHub的时候，就发现了一款神器：Excalidraw。试用起来就两个字：好用！一、简介 Excalidraw是一款开源的虚拟手绘风格白板，具有协作性和端到端加密功能，可在各种操作系统上使用，包括Windows、macOS、Linux，甚至移动设备。只需打开浏览器，就能够轻松绘制出精美的流程图、示意图、开发架构图等常见图形，同时还可以作为...

BhYoICNPeXOn 2023年12月02日 24 0 0 github 微信机器学习 github 微信机器学习

【深度学习】DeepMind：谁说卷积网络不如 ViT？

本文通过评估按比例扩大的NFNets，挑战了ConvNets在大规模上表现不如ViTs的观点。深度学习的早期成功可归功于卷积神经网络（ConvNets）的发展。近十年来，ConvNets主导了计算机视觉基准测试。然而近年来，它们越来越多地被ViTs（VisionTransformers）所取代。很多人认为，ConvNets在小型或中等规模的数据集上表现良好，但在那种比较大的网络规模的数据集上却无法与ViTs相竞争。与此同时，CV社区已经从评估随机初始化网络在特定数据集(如ImageNet)上的性能转变为评估从网络收集的大型通用数据集上预训练的网络的性能。这就提出了一个重要的问题：在...

BhYoICNPeXOn 2023年12月02日 31 0 0 数据集人工智能微信机器学习机器学习深度学习深度学习数据集微信人工智能

【机器学习】实践教程｜scikit-learn 的建模万能模板

编辑丨极市平台导读 scikit-learn的建模万能模板，可以根据自己的需求和数据量级选择一个合适的算法使用。算法工程师是伴随着人工智能火起来的一个领域。听着名字似乎门槛很高。但是，得益于Python生态下的包共享机制，机器学习模型构建的过程其实已经变得非常简单了，很多听起来牛逼的算法，其实根本不需要自己实现，甚至都不需要知道这些算法的具体原理。你只需要两步就能构建起自己的机器学习模型：明确你需要解决的问题是什么类型，以及知道解决该类型问题所对应的算法。从skicit-learn中调用相应的算法构建模型即可。是的！在机器学习领域，如果你只是抱着体验机器学习的心态，实现起来就是...

BhYoICNPeXOn 2023年12月02日 41 0 0 数据集数据集 Python 人工智能机器学习人工智能 scikit-learn scikit-learn python 机器学习

【深度学习】收藏 | 医学图像开源数据集汇总

3D-IRCADB脏器分割数据集数据集链接：http://m6z.cn/6x5OSn 3D-IRCADb-01数据库由10名女性和10名男性75%的肝肿瘤患者的3DCT扫描组成。20个文件夹对应20个不同的患者，可以单独下载也可以联合下载。下表提供了图像信息，例如肝脏大小（宽度、深度、高度）或根据Couninaud分割的肿瘤位置。它还表明肝脏分割软件可能遇到的主要困难是由于与邻近器官的接触、肝脏的非典型形状或密度，甚至图像中的伪影。 FASCICLE小腿肌肉超声数据集数据集链接：http://m6z.cn/631rex FAscicle小腿肌肉超声数据集是一个由812幅小腿肌肉超声...

BhYoICNPeXOn 2023年12月01日 29 0 0 人工智能人工智能深度学习机器学习机器学习深度学习数据集数据集 3d 3D

【学术相关】带了不太聪明的研究生是一种什么体验？

带了不太聪明的研究生是一种什么体验？导师和学生果然都是相互嫌弃的啊评论里众说纷纭，有人讲到真的有脑子不太灵光的学生，也有人讨伐题主说这个问题似乎想把某种矛盾转化为导师与学生之间的矛盾。网友评论 @匿名用户：坐标985，导师是青椒，副教授。经典对话 1.导师:这个东西我记得之前和你说过了吧？我:没有吧老师。导师:你看啊，这个是这个意思（不得不又讲了一遍）。 2.导师:这个东西我之前告诉过你。我:好像是，但我又忘了。导师:你不能总忘啊，也不能让老师一遍又一遍讲。我:我这次一定记住。导师:鱼的记忆都比你强。 3.导师:这个东西你自己琢磨琢磨，不能有啥问题都来问老师，你是...

BhYoICNPeXOn 2023年12月01日 31 0 0 微信微信机器学习机器学习 ide ide

【Python】盘点常见的AutoEDA工具库

在完成竞赛和数据挖掘的过程中，数据分析一直是非常耗时的一个环节，但也是必要的一个环节。能否使用一个工具代替人来完成数据分析的过程呢，现有的AutoEDA工具可以一定程度上完成上述过程。本文将盘点常见的AutoEDA工具，欢迎收藏转发。 PandasProfiling https://pandas-profiling.github.io/pandas-profiling/docs/master/index.html PandasProfiling是款比较成熟的工具，可以直接传入DataFrame即可完成分析过程，将结果展示为HTML格式，同时分析功能也比较强大。功能：字段类型分析、变量...

BhYoICNPeXOn 2023年12月01日 32 0 0 开发语言开发语言字段类型 python 机器学习数据分析数据分析机器学习 Python 字段类型

【机器学习】机器学习 4 个超参数搜索方法、代码

作者：Sivasai，编辑：AI公园 ML工作流中最困难的部分之一是为模型找到最好的超参数。ML模型的性能与超参数直接相关。介绍维基百科上说，“Hyperparameteroptimization或tuning是为学习算法选择一组最优的hyperparameters的问题”。 ML工作流中最困难的部分之一是为模型找到最好的超参数。ML模型的性能与超参数直接相关。超参数调优的越好，得到的模型就越好。调优超参数可能是非常乏味和困难的，更像是一门艺术而不是科学。超参数超参数是在建立模型时用于控制算法行为的参数。这些参数不能从常规训练过程中获得。在对模型进行训练之前，需要对它们进行赋值...

BhYoICNPeXOn 2023年11月19日 65 0 0 搜索人工智能深度学习 ML ML 机器学习人工智能搜索机器学习深度学习

终于，昨晚ChatGPT全线大崩溃！CEO亲自致歉：流量远超预期

金磊丰色 OpenAI前脚科技春晚炸翻全球，后脚自家院子却没能守住。原因无他，就是火爆，太太太太火爆！火爆到直接全线崩溃，无论是ChatGPT还是API，压根没法用，堪称史上最大的一次事故。从昨天深夜开始，很多小伙伴们跟ChatGPT的对话就变成这样了：我：出什么问题了吗？ ChatGPT：嗯……确实出了些问题。然后OpenAI官方也在事故报告中亮出了罕见的“红牌警告”：更为罕见的是，这次还连续出了两张： CEO奥特曼也亲自下场致歉：新功能的热度远远超出了我们的预期。我们原本计划是在周一的时候为所有订阅者提供GPTs，但现在仍然无法实现。我们希望这个进度能加快。由于...

BhYoICNPeXOn 2023年11月19日 35 0 0 chatgpt 人工智能微信 API 机器学习机器学习 API chatgpt 微信人工智能

【机器学习】哈工大硕士生用 Python 实现了 11 种经典数据降维算法，源代码库已开放...

网上关于各种降维算法的资料参差不齐，同时大部分不提供源代码。这里有个GitHub项目整理了使用Python实现了11种经典的数据抽取（数据降维）算法，包括：PCA、LDA、MDS、LLE、TSNE等，并附有相关资料、展示效果；非常适合机器学习初学者和刚刚入坑数据挖掘的小伙伴。 01 为什么要进行数据降维？所谓降维，即用一组个数为d的向量Zi来代表个数为D的向量Xi所包含的有用信息，其中d<D；通俗来讲，即将高维度下降至低维度；将高维数据下降为低维数据。通常，我们会发现大部分数据集的维度都会高达成百乃至上千，而经典的MNIST，其维度都是64。 MNIST手写数字数据集...

BhYoICNPeXOn 2023年11月19日 29 0 0 算法人工智能算法机器学习人工智能 python 机器学习开发语言开发语言 python