作者:韩柔刚阿里云,张康Intel 随着云基础业务类型和硬件资源的日益丰富,数据中心的资源利用率得到了显著提高,但也带来了资源争用的风险。在提高节点资源利用率的同时,确保应用程序的QoS(QualityofService),并避免NoisyNeighbor问题是一个关键挑战。 Koordinator和containerd作为云原生领域的开源项目,近期针对容器QoS的优化进行了深度合作,通过引入NRI(NodeResourceInterface,节点资源接口)的方式来优化容器的资源管理和QoS,解决先前资源管理模式中遇到的问题,大大提升了Koordinator部署的灵活性和处理的时效性,提供了一...

  G90lHPzMTNtE   2023年11月02日   46   0   0

如果您对于使用容器Kubernetes技术运行AI业务感兴趣; 如果您好奇容器Kubernetes技术如何支撑大模型的训练和推理; 如果您希望尝试基于容器Kubernetes快速定制化构建企业自己的AI工程化平台,以备企业新业务形态之需; 那么,您就是「云原生AI工程化实践训练营」的理想学员! 本期训练营是「云原生AI工程化实践训练营」三部曲的第二部,将带您学习使用ACK云原生AI套件完成模型微调训练任务、体验GPU共享推理服务能力,使用云原生网关MSE和容器服务ACKServerless构建智能聊天机器人。 本次训练营除了为您准备有视频课程、线上动手实验场景、入群1V1专人辅导学习手把手实验...

  G90lHPzMTNtE   2023年11月02日   44   0   0

作者:刘佳旭(花名:佳旭),阿里云容器服务技术专家 引言 随着云原生技术的快速发展以及在企业IT领域的深入应用,云原生场景下的高可用架构,对于企业服务的可用性、稳定性、安全性越发重要。通过合理的架构设计和云平台的技术支持,云原生高可用架构可以提供高可用性、弹性扩展性、简化运维管理、提升可靠性和安全性等方面的优势,为企业提供了更加可靠和高效的应用运行环境。 Kubernetes是云原生的核心技术之一,提供了容器编排和管理的能力,包括基础设施自动化、弹性扩展性、微服务架构和自动化运维等,所以Kubernetes的应用高可用架构是云原生高可用的基石。本文会以阿里云容器服务ACK(AlibabaClo...

  G90lHPzMTNtE   2023年11月02日   26   0   0

9月26日,阿里云云原生开放日在KubeCon期间顺利举办。本次活动,邀请了多位阿里云技术专家与开源社区小伙伴、企业用户一起,全面介绍了在云原生领域,包括K8s、微服务、Serverless、可观测、消息队列等在内的技术新趋势、项目新进展、实践新落地、前沿新探索。 扫描文中海报即可查看直播回放。 关注公众号,回复:0926资料 即可获取本次开放日讲师PPT合集 下面让我们一起回顾本次活动上的精彩议题。 分享主题:智能运维下的生产环境容器网络排障实践分享嘉宾:王炳燊李宇瞳 议题简介:容器智能运维服务是针对容器集群的一系列巡检、诊断工具平台,大大节省容器集群的运维精力。对于集群的网络问题也包含了...

  G90lHPzMTNtE   2023年11月02日   24   0   0

今天,由云原生计算基金会CNCF主办的KubeCon+CloudNativeCon+OpenSourceSummitChina2023主论坛在上海举办。阿里云容器服务负责人易立在主论坛发表演讲,介绍阿里云为大模型提供的基础设施能力,以及通过云原生AI的方式助力大模型普惠提效。 易立在主论坛现场演讲 大模型无疑是AI领域最重要的进展之一,生成式AI的惊艳表现让关于下一代人工智能“魔力”的讨论进入街头巷尾,也让云计算的行业价值和技术核心迎来再次升级。易立认为,“规模”、“性能”和“效率”正在成为影响大模型生产和应用的三个核心因素,也是企业基础设施在面临生产、使用大模型时的全新挑战。“为了应对这些...

  G90lHPzMTNtE   2023年11月02日   46   0   0

作者:李样兵、刘杉、木环、玖宇、鼎岳 云端的科学研究,AIforScience新范式 以往科学家们的科研工作需要经过大量实验的重复验证、复杂数学计算,以及长年累月的不断试错和苦苦探索。云计算基础服务的发展和人工智能技术AI的兴起,也给科研领域带来了新转变。 2019年,事件视界望远镜(EHT)团队公布了首张黑洞照片,这是全球30多个科研机构在云端协作的结果;团队成员可在全球调用各类云资源,数据处理周期从原本的数周压缩到数天。 哥伦比亚大学在云上进行气候科学研究,构建复杂的地球系统模型(ESM)模拟来理解模式并进行预测。利用卫星、无人机和传感器监测大陆、海洋和大气的不断增长的环境数据,来预测自然...

  G90lHPzMTNtE   2023年11月02日   29   0   0

作者:开迈斯新能源 开迈斯新能源科技有限公司于2019年5月16日成立,目前合资股东分别为大众汽车(中国)投资有限公司、中国第一汽车股份有限公司、一汽-大众汽车有限公司[增资扩股将在取得适当监督(包括反垄断)审批后完成]、万帮数字能源股份有限公司和安徽江淮汽车集团控股有限公司,总部位于江苏常州。开迈斯集车企与充电企业优势于一体,提供从充电基础设施的研发制造到软件的智能互联,从私人充电用户到半公共、公共以及商务用户,从电力供应的行业源头到服务平台的终端体验,实现每一个业态的前后端无缝连接。 开迈斯为中国新生代消费者而来,不仅注重私家电动车主的充电体验,还以高端的品质服务提供用户便捷无忧、智能高效...

  G90lHPzMTNtE   2023年11月02日   21   0   0

作者:董善东(梵登) 本文是作者于9月5日在QCon北京2023(全球软件开发大会)上做的《阿里云可观测AIOps的智能监控和诊断实践》专题演讲文字版。 大家上午好,很高兴可以在QCon稳定性和可观测的场子来分享阿里云可观测AIOps的智能监控和诊断实践。 我是来自阿里云云原生可观测团队的梵登。目前主要在可观测团队负责可观测AIOps产品Insights的商业化建设、AIOps解决方案的研发、大模型在可观测领域的探索等。很幸运的过去几年主导了ARMS在《GartnerAPM2022》和《信通院根因分析标准2023》的测评项目,因此今天也会分享我在测评过程中的一些心得体验。 今天主要会从以下四个...

  G90lHPzMTNtE   2023年11月02日   47   0   0

作者:华钟明 文章摘要: 本文整理自有赞中间件技术专家、ApacheDubboPMC华钟明的分享。本篇内容主要分为五个部分: -GraalVM 直面Java应用在云时代的挑战 -Dubbo 享受 AOT 带来的技术红利 -DubboNativeImage 的实践和示例 -Dubbo 集成 NativeImage 的原理和思考 -Dubbo 在 NativeImage 技术的未来规划 GraalVM直面Java应用在云时代的挑战 云计算时代比较显著的特点包括: 基于云计算的基础设施,...

  G90lHPzMTNtE   2023年11月02日   30   0   0

作者:山猎 茶百道是四川成都的本土茶饮连锁品牌,创立于2008年 。经过15年的发展,茶百道已成为餐饮标杆品牌,全国门店超7000家,遍布全国31个省市,实现中国大陆所有省份及各线级城市的全覆盖。2021年3月31日,在成渝餐·饮峰会中,茶百道斩获“2021成渝餐·饮标杆品牌奖”。2021年8月,入选艾媒金榜(iiMediaRanking)最新发布《2021年上半年中国新式茶饮品牌排行Top15》。2023年6月9日,新茶饮品牌“茶百道”获得新一轮融资,由兰馨亚洲领投,多家知名投资机构跟投,估值飙升至180亿元。 今年4月,茶百道在成都总部举行了品牌升级发布会,宣布门店数突破7000...

  G90lHPzMTNtE   2023年11月02日   27   0   0

作者:宋小生,平安壹钱包中间件资深工程师、ApacheDubbocommitter 可观测建设 首先介绍一下云原生升级的挑战。目前大部分公司里基本上都有CICD、DevOps来帮助开发、测试、运维提升开发的效率与质量,也会有容器化来帮助提升产线运维的效率与质量。但在云原生时代,大规模容器的频繁变更会带来很多稳定性的问题。这些稳定性问题,包含了很多我们可以提前规避掉的已知的异常,也包含了很多我们无法避免的异常,比如网络故障、机器宕机等系统无法提前避免的的问题。 如果我们能提前发现这些问题,其实是可以规避掉很多风险的。通过可观测系统及时的感知问题,高效的分析异常,快速的恢复系统。因此可以判定,在...

  G90lHPzMTNtE   2023年11月02日   31   0   0

作者:陈有为,陌陌研发工程师、ApacheDubboPMC RPC协议开发微服务 在我们正常开发微服务的时候,传统RPC服务可能在最底层。上层可能是浏览器、移动端、外界的服务器、自己的测试、curl等等。我们可能会通过Tomcat这种外部服务器去组装我们的RPC层,也就是BFF。或者我们没有BFF,我们的RPC就是对外提供服务。但因为浏览器要访问,所以我们需要有一个网关,比如说APISIX或者ShenYu等HTTP网关。 上图展示的是我们的流程,但是存在一些问题。 如果我们的服务是非常轻的,我们只需要一个转发层,无论是配网关还是起一个webserver去转发,怎么做都很麻烦。 此外,RPC...

  G90lHPzMTNtE   2023年11月02日   27   0   0

作者:屿山、十眠 微服务体系架构中,服务之间的依赖关系错综复杂,我们往往会使用负载均衡组件配合注册中心来实现服务间的感知。而这种感知行为需要调用方、负载均衡组件、注册中心、被调用方互相配合才能够实现,在出现问题时我们又可能很难确定是哪一部分的问题,在常规场景中,注册中心会有对应的控制台可以查看,而调用方、负载均衡组件、被调用方处则需要我们手动增加日志打印语句并重启应用才能得到相关的信息,而有些组件又难以找到合适的位置添加我们日志代码,使得这类问题的排查效率低下。 负载均衡原理剖析 我们以SpringCloud应用为例分析一下,微服务负载均衡到底是怎么一回事? 本文的demo包含log-...

作者:玄珏 前言 本文介绍RocketMQ负载均衡机制,主要涉及负载均衡发生的时机、客户端负载均衡对消费的影响(消息堆积/消费毛刺等)并且给出一些最佳实践的推荐。 负载均衡意义 上图是RocketMQ的消息储存模型:消息是按照队列的方式分区有序储存的。RocketMQ的队列模型使得生产者、消费者和读写队列都是多对多的映射关系,彼此之间都可以无限水平扩展。对比传统的消息队列如RabbitMQ是很大的优势。尤其是在流式处理场景下有天然优势,能够保证同一队列的消息被相同的消费者处理,对于批量处理、聚合处理更友好。 消费者消费某个topic的消息等同于消费这个topic上所有队列...

关注 更多

空空如也 ~ ~

粉丝 更多

空空如也 ~ ~