欧美成人三级一区二区在线观看,粉嫩粉嫩的18在线观看

據(jù)文化和旅游部數(shù)據(jù)中心測算，2023年“五一”假期全國國內(nèi)旅游出游合計2.74億人次，同比增長70.83%，按可比口徑恢復至2019年同期的119.09%¹。后疫情時代，旅游人數(shù)的激增與旅游場景的多元化，給人工智能（AI）技術在旅游行業(yè)的應用帶來更多機遇和挑戰(zhàn)。例如自然語言處理（NLP）、機器翻譯、計算機視覺、搜索排序等 AI 技術的快速發(fā)展和日臻成熟，可以為游客提供更便捷的服務和更精準的內(nèi)容。

作為一站式旅行平臺，攜程旅行已經(jīng)將諸多AI 技術應用于酒店、機票、自由行、跟團游、簽證、玩樂、租車等旅游度假的多個業(yè)務線，為全球用戶提供一套完整的旅行產(chǎn)品、服務及差異化的旅行內(nèi)容等。為了在滿足業(yè)務需求的同時降低成本壓力，攜程構建了基于英特爾至強可擴展處理器的 AI 推理算力平臺，并通過高性能算子庫、計算圖優(yōu)化、模型壓縮等方式提升 AI 推理性能。

? ? ? ? ? ?

采用英特爾至強解決方案

實現(xiàn)性能與經(jīng)濟性的更佳平衡

隨著 AI 應用的不斷擴展和深入，大型旅行服務平臺面臨的算力挑戰(zhàn)主要存在于兩個方面：

一方面，AI 技術正在日趨多樣化與復雜化，為了適應不同的業(yè)務場景需求，企業(yè)常常需要融合使用傳統(tǒng)機器學習、卷積神經(jīng)網(wǎng)絡、Transformer 等深度學習模型結(jié)構，以及知識圖譜、圖神經(jīng)網(wǎng)絡等技術。同時，AI模型的深度、寬度以及結(jié)構復雜度也在不斷提升，增加了企業(yè)的開發(fā)門檻，也使得 AI算力調(diào)度、AI 性能優(yōu)化更具挑戰(zhàn)。

另一方面，智能化應用正在迅速擴張，需要由 AI 模型處理的數(shù)據(jù)也在不斷增長。例如內(nèi)容與廣告?zhèn)€性化推薦、實時風控、機器翻譯、智能客服、圖像處理等領域正在越來越多地使用 AI 技術，以從海量的數(shù)據(jù)中生成高價值的商業(yè)洞察，從而帶來了較高的算力基礎設施建設成本。與此同時，上層應用對于 AI 模型推理也有著特定的服務級別協(xié)議 (SLA) 要求。企業(yè)需要在滿足 SLA 要求的前提下，通過模型優(yōu)化等方式，更好地發(fā)揮硬件的性能潛力，降低算力基礎設施的總體擁有成本（TCO）。

面對上述挑戰(zhàn)，企業(yè)首先要面臨硬件平臺的選擇問題：雖然基于獨立 GPU 的推理方案能夠提供強大的算力，但未必是一個經(jīng)濟的選擇。這是因為獨立 GPU 不僅采購或租用成本相對較高，而且通常是以專用服務器的模式進行部署和運維，帶來了較高的綜合成本。考慮到旅行服務中大量的 AI 推理場景所需要的性能經(jīng)過優(yōu)化能夠得到滿足，采用 CPU 的方案將更具成本效益。因此，攜程采用基于英特爾至強可擴展處理器的 AI 推理算力平臺，旨在為算法模型提供更全面易用、穩(wěn)定性更好、使用和維護成本更低的優(yōu)化解決方案。英特爾至強可擴展處理器內(nèi)置人工智能加速功能，已針對工作負載進行優(yōu)化，能夠為各種AI 應用以及高密度基礎設施帶來一流的性能和內(nèi)存帶寬。同時，采用矢量神經(jīng)網(wǎng)絡指令(VNNI) 的英特爾深度學習加速（英特爾DL Boost），能夠有效提高 AI 推理的表現(xiàn)，使其成為深度學習應用的卓越基礎設施。

? ? ? ? ? ?

構建并優(yōu)化AI推理算力平臺

Bert-base推理時間由15毫秒降至6毫秒

在基于英特爾至強可擴展處理器的硬件平臺層基礎上，攜程構建了 AI 推理算力平臺，該平臺還包括引擎框架層、推理優(yōu)化層、算法模型、應用場景。同時，為了盡可能地提升 AI 推理性能，釋放硬件潛力，攜程進行了推理優(yōu)化。主要的優(yōu)化思路為兩點：一是通過調(diào)整/簡化模型結(jié)構，或改進算法以降低算法復雜度；二是優(yōu)化軟件執(zhí)行效率，使用硬件優(yōu)勢特征，提升硬件執(zhí)行效率。

攜程基于英特爾至強可擴展處理器的硬件平臺層基礎上

構建 AI 推理算力平臺

攜程以機器翻譯應用的 Transformer模型來測試其性能表現(xiàn)。在該測試中，攜程除了使用上述的優(yōu)化方法，還分割模型并使用 jit 跟蹤方法來提高性能。同時，在batchsize 超過 16 個的情況下，使用 mm op 進行優(yōu)化。攜程使用固定算例的平均響應時延作為測試數(shù)據(jù)，tokens 為 10，batchsize=1，Bert-base模型推理時間由優(yōu)化前的15.05毫秒降至優(yōu)化后的6.44毫秒²。

Bert-base 模型優(yōu)化前后的性能對比²

基于英特爾至強可擴展平臺的基礎算力和深度的 AI 模型推理性能優(yōu)化，用戶將獲得的收益包括：在特定的 SLA 要求下，降低 AI 推理應用的 TCO

在通過本輪優(yōu)化之后，攜程的 CPU 服務器 AI 推理性能得到提升，能夠滿足大量 AI 推理場景對于時延等 SLA 指標的要求，避免了在昂貴的專用 AI 加速器方面的支出。

提升基礎設施的敏捷性與靈活性

通過本輪優(yōu)化，攜程能夠高效利用現(xiàn)有的 CPU 服務器，根據(jù)實際負載需求進行靈活調(diào)度，而無需為 AI 推理新增需求部署專用服務器。

為 AI 推理性能優(yōu)化提供了標準的參考流程

本方案提供了一套標準、可自動完成的參考模型優(yōu)化流程，能夠賦能更多的 AI 應用。

攜程與英特爾的合作，驗證了 AI 模型推理方案在英特爾至強可擴展處理器上的應用潛力，在成本、性能方面實現(xiàn)了平衡。同時，隨著推理性能優(yōu)化技術的逐步提高，將極大地降低人工智能應用的部署成本，加快AI應用的落地速度并擴充應用場景，推動人工智能行業(yè)的整體發(fā)展。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

英特爾

英特爾

+關注

關注
60

文章
9861

瀏覽量
171289
cpu

cpu

+關注

關注
68

文章
10804

瀏覽量
210829

原文標題：攜程攜手英特爾優(yōu)化AI推理性能，提升性能的同時降低TCO

文章出處：【微信號：英特爾中國，微信公眾號：英特爾中國】歡迎添加關注！文章轉(zhuǎn)載請注明出處。

開箱即用，AISBench測試展示英特爾至強處理器的卓越推理性能

。中國電子技術標準化研究院賽西實驗室依據(jù)國家標準《人工智能服務器系統(tǒng)性能測試規(guī)范》（征求意見稿）相關要求，使用AISBench?2.0測試工具，完成了第五代英特爾至強可擴展處理器的AI大模型

發(fā)表于 09-06 15:33 ?261次閱讀

英特爾新一代AI PC酷睿Ultra處理器強勢來襲

近日，在臺北國際電腦展上，英特爾展示了大力加速AI生態(tài)的前沿技術和架構，遍及數(shù)據(jù)中心、云與網(wǎng)絡邊緣和PC。得益于更高計算處理性能、出色的能效表現(xiàn)、和更低的總體擁有成本（TCO），用戶能

發(fā)表于 06-15 11:39 ?831次閱讀

英特爾發(fā)布AI創(chuàng)作應用AI Playground，將于今夏正式上線！

的AI PC入門應用程序AI Playground，讓廣大用戶在本地即可快速實現(xiàn)AI個性化創(chuàng)作。 英特爾Xe2 GPU架構，帶來50%的性能

發(fā)表于 06-14 09:44 ?406次閱讀

英特爾助力京東云用CPU加速AI推理，以大模型構建數(shù)智化供應鏈

英特爾助力京東云用CPU加速AI推理，以大模型構建數(shù)智化供應鏈

發(fā)表于 05-27 11:50 ?474次閱讀

寧暢B5000 G5多節(jié)點服務器采用第五代英特爾至強可擴展處理器

“基于第五代英特爾 至強可擴展處理器的寧暢B5000 G5多節(jié)點服務器，可以在滿足大量AI推理場景在吞吐量、時延、容量、并發(fā)能力等方面的需求，而且與專用的GPU服務器相比，在靈活性方面更具優(yōu)勢。我們希望能夠與

發(fā)表于 05-27 11:46 ?749次閱讀

自然語言處理應用LLM推理優(yōu)化綜述

當前，業(yè)界在將傳統(tǒng)優(yōu)化技術引入 LLM 推理的同時，同時也在探索從大模型自回歸解碼特點出發(fā)，通過調(diào)整推理過程和引入新的模型結(jié)構來進一步

發(fā)表于 04-10 11:48 ?541次閱讀

借助英特爾? QAT從而顯著提升網(wǎng)絡和存儲應用的性能

全新第四代和第五代英特爾? 至強? 可擴展處理器內(nèi)置英特爾? 數(shù)據(jù)保護與壓縮加速技術（英特爾? QAT），可通過卸載計算密集型工作負載來降低 CPU 占用率，從而顯著

發(fā)表于 03-18 16:25 ?854次閱讀

借助英特爾DLB技術優(yōu)化網(wǎng)絡性能

英特爾? DLB技術的出現(xiàn)，無疑為數(shù)據(jù)處理和網(wǎng)絡傳輸領域帶來了一場革命性的變革。通過其獨特的負載均衡、數(shù)據(jù)包調(diào)度優(yōu)先排序以及降低網(wǎng)絡流量時延的能力，英特爾? DLB顯著提升了高數(shù)據(jù)包速

發(fā)表于 03-11 09:52 ?566次閱讀

是德科技與英特爾攜手完成負載均衡單節(jié)點2100萬連接新建性能測試

2024年1月18日，是德科技（Keysight Technologies,Inc.）與英特爾攜手完成負載均衡產(chǎn)品單節(jié)點2100萬連接新建性能測試。英特爾提供軟硬件結(jié)合

發(fā)表于 01-18 14:11 ?550次閱讀

英特爾AMX助華棲云多場景AI推理性能大幅提升多達96倍

AI技術應用已經(jīng)深入到各行各業(yè)，特別是云服務提供商將AI能力集成到云服務中，能夠更好地滿足用戶對性能、效率和體驗的需求。

發(fā)表于 01-13 10:46 ?954次閱讀

英特爾專家為您揭秘第五代英特爾? 至強? 可擴展處理器如何為AI加速

% 1 ，AI 推理性能提升42% 2 。這一系列性能提升的背后，存在著怎樣的創(chuàng)新與突破？第五代英特爾

發(fā)表于 12-23 12:20 ?696次閱讀

CPU也可以完美運行大模型 英特爾第五代至強重磅發(fā)布

處理器,它來了! 若是用一句話來概括它的特點,那就是——AI味道越發(fā)得濃厚。以訓練、推理大模型為例: ? ? ? ? ? ? 與第四代相比,訓練性能提升多達29%,

發(fā)表于 12-22 11:52 ?597次閱讀

英特爾Gaudi 3系列AI加速器明年上市

英特爾總裁帕特·基辛格（Pat Gelsinger）認為，鑒于英特爾Gaudi3具備的持續(xù)加強的性能優(yōu)勢和極具競爭性的TCO及定價機制，預測該產(chǎn)品有望在2024年憑借領先的

發(fā)表于 12-15 11:07 ?754次閱讀

英特爾發(fā)布第五代至強可擴展處理器：性能和能效大幅提升，AI 加速

此外，至強可擴展處理器被譽為行業(yè)首屈一指的內(nèi)置AI加速器數(shù)據(jù)中心處理器，全新第五代產(chǎn)品更能優(yōu)化參數(shù)量高達200億的大型語言模型，使其推理性能提升42％。眼下，它還是唯一歷次刷新MLPe

發(fā)表于 12-15 11:02 ?794次閱讀

用上這個工具包，大模型推理性能加速達40倍

作者： 英特爾公司沈海豪、羅嶼、孟恒宇、董波、林俊編者按：只需不到9行代碼，就能在CPU上實現(xiàn)出色的LLM推理性能。 英特爾 ?Extension for Transformer 創(chuàng)新

發(fā)表于 12-01 20:40 ?1084次閱讀