欢迎光临AG官方登录入口_AG亚娱官方网站入口!
服务热线:400-123-4567

新闻资讯

删除AI时,您应该选择云还是有效?

日期:2025-06-15 10:07 浏览:
自从DeepSeek在年初开始流行以来,越来越多的公司开始尝试通过AI提高效率。我们面前的问题是:我们应该通过云服务购买令牌,还是购买AI多合一的机器或服务器进行私人扩展?许多行业内部人士告诉Leifeng.com,从长远来看,基于云的AI的部署方法将是基本的。一方面,AI能力正在迅速出现。另一方面,在探索AI应用程序的过程中,计算的强度和企业要求的能力将继续改变,并且云计算显示出更强的灵活性和扩展效率。在2025年2025火山引擎弹簧电力会议的英特尔副法院中,Intel技术Leifeng.com(公共帐户:Leifeng.com)的专家:“有些公司很长一段时间都有稳定的需求。当成功部署现有的AI解决方案时,他们不需要经常替换解决方案。更令人不安地私有化扩展。 “正如瓦申·天兴(Huasheng Tiancheng)助理总裁郭陶(Guo Tao)在论坛上所说:“ AI价值并不属于技术本身,但如果它确实有助于客户降低成本并提高效率。 “ - 可以使用结合云和私有化的混合体的定义。在许多情况下,它也是一个不错的选择。将AI部署到云的成本可以节省高达83%。将云部署视为未来的云部署的原因,这是计算和有效的大量范围。 CPU计算能力。该劳动模型的部门要求企业同时升级两种类型的计算能源,以满足端到端的AI业务需求。通过CPU和GPU的完全合作来实现效率;提供Eyeas灵活,并可以确保客户的安全性和隐私。在火山引擎2025 Spring Power会议上,火山发动机和英特尔共同发布了基于英特尔Xeon 6的最新处理器的新第四代ECS家庭示例,并进行了全面的性能和建筑升级。与这一代人的先前情况相比,一般计算过早的示例分别在MySQL数据库和Web应用程序中获得了20%和19%的性能提高。在视频解码和图像渲染中,计算强度通过计算强度分别提高了15%和26%的机会; I/O的改善机会在Spark Big Data和Redis数据库方面取得了13%和30%的提高。网络功能和存储第四代EC的机会也已完全升级,整个网络和带宽存储都增加了100%,IOP和PPS增加了ED占30%以上,CPU的主要频率增加了20%。除了改善一般方案的性能外,针对AI应用程序的最新示例,火山和英特尔发动机还以 - 深度优化了RAG应用程序,涵盖上传文本。随着Xeon 6处理器教学范围内的内置AMX加速度,工作时间可以减少多达90%,从而大大提高了全链路效率。火山引擎和英特尔团队对经典的WDL(广泛研究)进行了深入研究,广泛用于推荐和广告。通过优化AMX,CPU识别性能取得了合格的跳跃。复制后,CPU吞吐量的能力增加了114%,这显着提高了模型识别的效率。这些改进是基于Intel Xeon 6处理器的性能的重大改进。一般计算,Web和AI服务,6900 Xeon 6系的总体表现提高了2次以上,并且性能消耗的比率提高了1.4倍。随着相同的电力消耗,与上一代相比,Xeon 6处理器提高了1.4倍以上。如果固定核心的数量,除了改善电力消耗外,它仍然可以提供20%的性能提高。对于云计算,Xeon 6可以达到2倍的核心密度,20%的单核绩效提高,60%的性能功耗比例,并最终获得30%的TCO福利。与该行业示例的第一个灵活的销售模型一起,与火山引擎结合使用,使客户提前预订了Tiktok Resources,同时获得使用数量和价格接近年度每月订阅的经验。 Li Yueyuan提出的是,与传统的计费示例相比,灵活的预订使用可以多达83%的计算强度成本。当前,灵活的预订销售方法已完全支持CPU和GPU机会。如何降低将AI部署到云的阈值?云中其余的灵活性和灵活性是它具有一定的发展阈值。降低开发阈值并依靠好的软件堆栈。英特尔专家说,一个好的软件堆栈需要满足某些条件:首先,它开箱即用,迅速站起来并在新环境中具有真正价值的“ Hello World”示例,以帮助用户快速启动;其次,应该看到和修改它,主要成分应透明,可见和调整,以避免成为“黑匣子”,这也是开放资源的重要价值之一;最后,考虑到AI应用程序的复杂性,软件堆栈应具有井模构和容器体系结构,这对于柔性组合和出色的扩展非常方便。基于ABOVE注意事项,英特尔已成为基于OPEA的集成开源项目,并在火山云中提供了基于OPEA的开发环境,提供了诸如聊天机器人之类的应用程序,并将在将来继续更新。这只是一个介绍,要实施AI,有必要继续前进。 “在系统设计之后,我们启动了“云进化论”系列在线课程。通过在线提供的高级视频,开发人员可以在整个链接中看到端到端的技能和优化方法。”专家被介绍给英特尔技术。为了进一步应对AI系统的复杂性,英特尔将以容器方式封闭各种服务服务,提供多种不同的火山发动机服务,以帮助开发人员了解国际化的介绍,而开发人员更方便地替换,升级,升级或扩展许多机会。目前,在火山引擎G4IL中例如,用户可以在操作系统选项中看到一个名为“开源大型应用程序知识问题和答案”的新图像。基于OPEA,选择,单击和开始步骤后,可以在两分钟内部署一个可用的聊天机器人示例。为了推进更复杂的代理应用程序,英特尔与MCP服务器上的玻璃知识,工具链和多模式组件的基础集成在一起,并将通过联合接口打开代理调用。 “通过与火山引擎的合作,我们提供了一个低位且易于使用的硬件环境,开放的白头软件堆栈以及从专家到专家的各种培训视频,从简单到复杂。”英特尔技术人员说,“所有这些都将降低AI在云中的AI部署的限制。”正如Intel China的互联网行业行业总监Li Zhihui所说。 Core-Cloud进入一个新的阶段,即来回移动生态共同建设技术的整合。我们呼吁更多的合作伙伴参与,以在整个筹码,云服务和应用程序层中建立开放标准,以降低生态合作的成本。 “ 32b模型:AI的甜点,即使云计算是灵活,有效的,私有化的扩展仍然是高度关注私人隐私的企业的首选,并且对每个人的有效成本是一个不错的选择。这种类型的解决方案不仅要求硬件平台具有成本效益,而且还可以确保AI影响能够满足AI的效果。 32B模型性能很棒,范围足够多。此外,由于模型相对较小,并且对计算强度的需求相对较低,因此使用消费者的GPU可以满足某些侧面应用的需求。”已采用了英特尔Xeon处理器和许多英特尔Ruixuan图形卡,新的Intel Ruixuan Pro B60已被采用。一张卡可以提供24GB的图形内存,在上下文扩展和共存扩展的情况下提供更强的处理功能。但是,硬件只是基础,开发人员更关心转移成本。因此,英特尔与VLLM和Pytorch一起提供了完整的软件堆栈以及专门针对Enterprise AI平台(EAP)的服务,以帮助客户迁移到Intel平台。 “我想强调的是,除了提供这项服务外,我们还与许多行业应用联系了,例如与火山引擎的Hiagent合作。”专家在英特尔技术方面说。 Hiagent是由火山引擎基于代理DevOps的概念建造的代理平台,支持模型访问,推理,集成和集成私有化。在英特尔的多合一解决方案中,用户可以部署H直接为了满足您将要问的业务层面的私人扩张。目前,Intel,火山引擎Hiagent和Huasheng Tiancheng共同创建了基于Intel Ruixuan图形卡计算功率平台的Hiagent多合一解决方案,该解决方案可以为市场提供高成本和更可扩展的AI多合一解决方案。 Huasheng Tiancheng积极促进AI的业务实施,并将其服务能力扩展到更多客户。作为在智能呼叫中心拥有20年经验的企业,Huasheng Tiancheng的智能产品被广泛用于财务,烟草和车辆等许多行业。在内部首次使用竞标瓦申金国王的另一个产品是在内部使用的,因为惠山·天兴(Huasheng Tiancheng)作为集成商,每年不得不投资数千个出价。使用竞标之王后,这将效率提高了约50%。现在,如何部署AI的答案不再模糊。无论是技术还是生态学,英特尔,火山发动机和其他合作伙伴为云AI提供了完整的私有化和解决方案,扩展阈值继续降低。关键是企业是否可以找到适合AI的业务场景并真正实现其价值。
首页
电话
短信
联系