新闻资讯

删除AI时，您应该选择云还是有效？

日期：2025-06-15 10:07 浏览：

自从DeepSeek在年初开始流行以来，越来越多的公司开始尝试通过AI提高效率。我们面前的问题是：我们应该通过云服务购买令牌，还是购买AI多合一的机器或服务器进行私人扩展？许多行业内部人士告诉Leifeng.com，从长远来看，基于云的AI的部署方法将是基本的。一方面，AI能力正在迅速出现。另一方面，在探索AI应用程序的过程中，计算的强度和企业要求的能力将继续改变，并且云计算显示出更强的灵活性和扩展效率。在2025年2025火山引擎弹簧电力会议的英特尔副法院中，Intel技术Leifeng.com（公共帐户：Leifeng.com）的专家：“有些公司很长一段时间都有稳定的需求。当成功部署现有的AI解决方案时，他们不需要经常替换解决方案。更令人不安地私有化扩展。 “正如瓦申·天兴（Huasheng Tiancheng）助理总裁郭陶（Guo Tao）在论坛上所说：“ AI价值并不属于技术本身，但如果它确实有助于客户降低成本并提高效率。 “ - 可以使用结合云和私有化的混合体的定义。在许多情况下，它也是一个不错的选择。将AI部署到云的成本可以节省高达83％。将云部署视为未来的云部署的原因，这是计算和有效的大量范围。 CPU计算能力。该劳动模型的部门要求企业同时升级两种类型的计算能源，以满足端到端的AI业务需求。通过CPU和GPU的完全合作来实现效率；提供Eyeas灵活，并可以确保客户的安全性和隐私。在火山引擎2025 Spring Power会议上，火山发动机和英特尔共同发布了基于英特尔Xeon 6的最新处理器的新第四代ECS家庭示例，并进行了全面的性能和建筑升级。与这一代人的先前情况相比，一般计算过早的示例分别在MySQL数据库和Web应用程序中获得了20％和19％的性能提高。在视频解码和图像渲染中，计算强度通过计算强度分别提高了15％和26％的机会； I/O的改善机会在Spark Big Data和Redis数据库方面取得了13％和30％的提高。网络功能和存储第四代EC的机会也已完全升级，整个网络和带宽存储都增加了100％，IOP和PPS增加了ED占30％以上，CPU的主要频率增加了20％。除了改善一般方案的性能外，针对AI应用程序的最新示例，火山和英特尔发动机还以 - 深度优化了RAG应用程序，涵盖上传文本。随着Xeon 6处理器教学范围内的内置AMX加速度，工作时间可以减少多达90％，从而大大提高了全链路效率。火山引擎和英特尔团队对经典的WDL（广泛研究）进行了深入研究，广泛用于推荐和广告。通过优化AMX，CPU识别性能取得了合格的跳跃。复制后，CPU吞吐量的能力增加了114％，这显着提高了模型识别的效率。这些改进是基于Intel Xeon 6处理器的性能的重大改进。一般计算，Web和AI服务，6900 Xeon 6系的总体表现提高了2次以上，并且性能消耗的比率提高了1.4倍。随着相同的电力消耗，与上一代相比，Xeon 6处理器提高了1.4倍以上。如果固定核心的数量，除了改善电力消耗外，它仍然可以提供20％的性能提高。对于云计算，Xeon 6可以达到2倍的核心密度，20％的单核绩效提高，60％的性能功耗比例，并最终获得30％的TCO福利。与该行业示例的第一个灵活的销售模型一起，与火山引擎结合使用，使客户提前预订了Tiktok Resources，同时获得使用数量和价格接近年度每月订阅的经验。 Li Yueyuan提出的是，与传统的计费示例相比，灵活的预订使用可以多达83％的计算强度成本。当前，灵活的预订销售方法已完全支持CPU和GPU机会。如何降低将AI部署到云的阈值？云中其余的灵活性和灵活性是它具有一定的发展阈值。降低开发阈值并依靠好的软件堆栈。英特尔专家说，一个好的软件堆栈需要满足某些条件：首先，它开箱即用，迅速站起来并在新环境中具有真正价值的“ Hello World”示例，以帮助用户快速启动；其次，应该看到和修改它，主要成分应透明，可见和调整，以避免成为“黑匣子”，这也是开放资源的重要价值之一；最后，考虑到AI应用程序的复杂性，软件堆栈应具有井模构和容器体系结构，这对于柔性组合和出色的扩展非常方便。基于ABOVE注意事项，英特尔已成为基于OPEA的集成开源项目，并在火山云中提供了基于OPEA的开发环境，提供了诸如聊天机器人之类的应用程序，并将在将来继续更新。这只是一个介绍，要实施AI，有必要继续前进。 “在系统设计之后，我们启动了“云进化论”系列在线课程。通过在线提供的高级视频，开发人员可以在整个链接中看到端到端的技能和优化方法。”专家被介绍给英特尔技术。为了进一步应对AI系统的复杂性，英特尔将以容器方式封闭各种服务服务，提供多种不同的火山发动机服务，以帮助开发人员了解国际化的介绍，而开发人员更方便地替换，升级，升级或扩展许多机会。目前，在火山引擎G4IL中例如，用户可以在操作系统选项中看到一个名为“开源大型应用程序知识问题和答案”的新图像。基于OPEA，选择，单击和开始步骤后，可以在两分钟内部署一个可用的聊天机器人示例。为了推进更复杂的代理应用程序，英特尔与MCP服务器上的玻璃知识，工具链和多模式组件的基础集成在一起，并将通过联合接口打开代理调用。 “通过与火山引擎的合作，我们提供了一个低位且易于使用的硬件环境，开放的白头软件堆栈以及从专家到专家的各种培训视频，从简单到复杂。”英特尔技术人员说，“所有这些都将降低AI在云中的AI部署的限制。”正如Intel China的互联网行业行业总监Li Zhihui所说。 Core-Cloud进入一个新的阶段，即来回移动生态共同建设技术的整合。我们呼吁更多的合作伙伴参与，以在整个筹码，云服务和应用程序层中建立开放标准，以降低生态合作的成本。 “ 32b模型：AI的甜点，即使云计算是灵活，有效的，私有化的扩展仍然是高度关注私人隐私的企业的首选，并且对每个人的有效成本是一个不错的选择。这种类型的解决方案不仅要求硬件平台具有成本效益，而且还可以确保AI影响能够满足AI的效果。 32B模型性能很棒，范围足够多。此外，由于模型相对较小，并且对计算强度的需求相对较低，因此使用消费者的GPU可以满足某些侧面应用的需求。”已采用了英特尔Xeon处理器和许多英特尔Ruixuan图形卡，新的Intel Ruixuan Pro B60已被采用。一张卡可以提供24GB的图形内存，在上下文扩展和共存扩展的情况下提供更强的处理功能。但是，硬件只是基础，开发人员更关心转移成本。因此，英特尔与VLLM和Pytorch一起提供了完整的软件堆栈以及专门针对Enterprise AI平台（EAP）的服务，以帮助客户迁移到Intel平台。 “我想强调的是，除了提供这项服务外，我们还与许多行业应用联系了，例如与火山引擎的Hiagent合作。”专家在英特尔技术方面说。 Hiagent是由火山引擎基于代理DevOps的概念建造的代理平台，支持模型访问，推理，集成和集成私有化。在英特尔的多合一解决方案中，用户可以部署H直接为了满足您将要问的业务层面的私人扩张。目前，Intel，火山引擎Hiagent和Huasheng Tiancheng共同创建了基于Intel Ruixuan图形卡计算功率平台的Hiagent多合一解决方案，该解决方案可以为市场提供高成本和更可扩展的AI多合一解决方案。 Huasheng Tiancheng积极促进AI的业务实施，并将其服务能力扩展到更多客户。作为在智能呼叫中心拥有20年经验的企业，Huasheng Tiancheng的智能产品被广泛用于财务，烟草和车辆等许多行业。在内部首次使用竞标瓦申金国王的另一个产品是在内部使用的，因为惠山·天兴（Huasheng Tiancheng）作为集成商，每年不得不投资数千个出价。使用竞标之王后，这将效率提高了约50％。现在，如何部署AI的答案不再模糊。无论是技术还是生态学，英特尔，火山发动机和其他合作伙伴为云AI提供了完整的私有化和解决方案，扩展阈值继续降低。关键是企业是否可以找到适合AI的业务场景并真正实现其价值。

新闻资讯

删除AI时，您应该选择云还是有效？

AG官方

产品展示

新闻资讯

成功案例

联系我们