【生態(tài)專場二】天翼云科技有限公司行業(yè)中心總經(jīng)理張星:構(gòu)筑數(shù)字化底座,天翼云助力汽車行業(yè)數(shù)字化轉(zhuǎn)型

泰達(dá)汽車論壇2024-08-31
37670

由中國汽車技術(shù)研究中心有限公司、中國汽車工程學(xué)會、中國汽車工業(yè)協(xié)會、中國汽車報(bào)社共同主辦,天津經(jīng)濟(jì)技術(shù)開發(fā)區(qū)管理委員會特別支持,日本汽車工業(yè)協(xié)會、德國汽車工業(yè)協(xié)會、中國汽車動力電池產(chǎn)業(yè)創(chuàng)新聯(lián)盟、新能源汽車國家大數(shù)據(jù)聯(lián)盟聯(lián)合協(xié)辦的第二十屆中國汽車產(chǎn)業(yè)發(fā)展(泰達(dá))國際論壇(以下簡稱“泰達(dá)汽車論壇”)于2024年8月29日至9月1日在天津?yàn)I海新區(qū)舉辦。本屆論壇以“風(fēng)雨同舟二十載 攜手并肩向未來”為年度主題,邀請重磅嘉賓展開深入研討。

在8月30日“生態(tài)專場二:加速云計(jì)算與數(shù)字技術(shù)應(yīng)用,推動新質(zhì)型產(chǎn)業(yè)發(fā)展”中,天翼云科技有限公司行業(yè)中心總經(jīng)理張星發(fā)表了題為“構(gòu)筑數(shù)字化底座,天翼云助力汽車行業(yè)數(shù)字化轉(zhuǎn)型”的演講。

天翼云科技有限公司行業(yè)中心總經(jīng)理張星.png天翼云科技有限公司行業(yè)中心總經(jīng)理張星

以下為演講實(shí)錄:

各位嘉賓、各位朋友,大家上午好。

當(dāng)前通用計(jì)算、智算以及超算一體化發(fā)展,中國電信在業(yè)內(nèi)做云計(jì)算是比較早的,在運(yùn)營商里面應(yīng)該是最早介入的。下面我簡單匯報(bào)一下天翼云從成立之初到今天的重要節(jié)點(diǎn)和歷程。

中國電信最早在2009年就提出了布局云計(jì)算的戰(zhàn)略,2012年成立天翼云公司,開始正式的商業(yè)化運(yùn)作云計(jì)算。2015年,習(xí)總書記蒞臨中國電信貴州園區(qū),寄語中國電信志存高遠(yuǎn),也鼓勵中國電信在國家的信息安全底座方面發(fā)揮央企責(zé)任擔(dān)當(dāng)。

天翼云在成立之初是以分公司運(yùn)作的,2018年承接了到目前為止仍是業(yè)界最大的iCloud云存儲。2021年,中國電信推進(jìn)國企深化改革,在國家相關(guān)部委政府的主導(dǎo)下,我們聯(lián)合幾家央企共同創(chuàng)建國家云。于是在2021年天翼云由分公司改為子公司,時(shí)任國務(wù)委員王勇給公司揭牌,體現(xiàn)了國家對于天翼云底座承接國家信息安全底座的期許。

2022年的福州數(shù)字峰會上,國資監(jiān)管平臺正式上線天翼云。2023年的第六屆數(shù)字峰會上,正式對外宣布天翼云作為國家云計(jì)算底座已經(jīng)成型。2024年人工智能風(fēng)生水起,天翼云把云計(jì)算底座進(jìn)行了升級和擴(kuò)展后,打造了集算力、平臺、數(shù)據(jù)、模型和應(yīng)用五位一體的智能云算力體系。

中國電信作為國家云,已經(jīng)進(jìn)入邁向智能云的拐點(diǎn)。在智能云的核心平臺里面,我們構(gòu)建了“息壤”一體化智算服務(wù)體系和能力,具備強(qiáng)大的算網(wǎng)調(diào)度能力和高效的異構(gòu)計(jì)算能力,包括一站式的訓(xùn)推服務(wù)和豐富的行業(yè)應(yīng)用?!跋⑷馈彼懔ζ脚_能夠把現(xiàn)在分散在全國各地的算力進(jìn)行統(tǒng)一調(diào)度,目前已經(jīng)在很多地方都實(shí)現(xiàn)了案例落地。

云計(jì)算其實(shí)在中國已經(jīng)蓬勃發(fā)展了十多年。泰達(dá)論壇作為汽車行業(yè)的論壇,設(shè)有云計(jì)算的分論壇,也預(yù)示著隨著人工智能的興起,下一階段的云計(jì)算和汽車行業(yè)的結(jié)合會越來越深入。在汽車行業(yè)數(shù)字化轉(zhuǎn)型的背景下,未來汽車行業(yè)肯定也是往智能化、網(wǎng)聯(lián)化方向發(fā)展,云計(jì)算在其中具有不可或缺的重要作用。

作為IT行業(yè)的從業(yè)者,我們對汽車行業(yè)的數(shù)字化轉(zhuǎn)型做了一些總結(jié)和分析。在我們看來,汽車行業(yè)的數(shù)字化轉(zhuǎn)型面臨以下幾個問題:(1)缺少信息系統(tǒng)的一體化頂層設(shè)計(jì);(2)缺少統(tǒng)一的數(shù)據(jù)管理和服務(wù)的平臺;(3)缺少敏捷開發(fā)的環(huán)境;(4)缺少一體化安全防護(hù)的能力;(5)缺少資源管理統(tǒng)一的抓手。

上面的問題并不針對所有的汽車企業(yè),只是經(jīng)過我們的一些實(shí)踐及分析,提出了業(yè)界數(shù)字化轉(zhuǎn)型可能會面臨的問題?;诖?,作為信息化的使能者和算力的提供者,我們也會定制化推出相應(yīng)的平臺。

天翼云邁過了向智能云拐點(diǎn)的重要標(biāo)志,是五位一體體系的成熟。在算力層面,我們有智能的算力、智能的網(wǎng)絡(luò)和人工智能賦能之下的新型數(shù)據(jù)中心。天翼云將堅(jiān)定不移地投入自主研發(fā),不斷突破卡脖子核心技術(shù)。

從2012年成立以來,目前員工已經(jīng)接近5000人,其中不包括分散在全國各地電信的銷售體系人員。通過幾年的高投入,我們已經(jīng)擁有了全套自主可控的平臺,電信內(nèi)部也成立了AI公司和專業(yè)的數(shù)據(jù)應(yīng)用團(tuán)隊(duì),在大模型、智能智算服務(wù)方面開展了深入研究。

業(yè)界普遍認(rèn)為,運(yùn)營商的數(shù)據(jù)相對來說是比較優(yōu)質(zhì)的,我們在做好用戶信息保護(hù)的前提下,力求最大程度地應(yīng)用于社會和實(shí)踐。天翼云具有豐富的行業(yè)生態(tài),五位一體構(gòu)筑了天翼智能云的服務(wù)體系,這套體系賦能車企也是正當(dāng)其時(shí),服務(wù)車企的智能化、數(shù)字化轉(zhuǎn)型。

下面說一下算力。運(yùn)營商開玩笑說中國電信是“新基建狂魔”,在數(shù)據(jù)中心、基礎(chǔ)設(shè)施、網(wǎng)絡(luò)建設(shè)方面是我們的使命和強(qiáng)項(xiàng)。我們在人工智能企業(yè)比較集中的如北上廣、浙江、安徽等地都建立了智算中心,在綠色能源比較充沛的地域,如內(nèi)蒙、貴州、寧夏等我們也有相應(yīng)的部署。智算中心不單單是要服務(wù)一個企業(yè),還要體現(xiàn)國家“雙碳”的目標(biāo),充分利用綠色能源。

我們在北京、上海建的萬卡算力資源池已經(jīng)投入了使用,未來我們還會根據(jù)市場的需求逐步擴(kuò)大建設(shè)。萬卡算力資源池不是簡單地把卡拿來堆疊提供服務(wù),其中有非常復(fù)雜的系統(tǒng)工程算法和性能調(diào)優(yōu)。目前天翼云自有的總算力已經(jīng)超過了21億,并且還在不斷增長中。我們實(shí)現(xiàn)了一云多態(tài),天翼云平臺上有主流的GPU、NPU,公有云、私有云、邊緣計(jì)算等都可以在這個平臺上承載。我們自建的豐富算力和多種多樣云計(jì)算的形態(tài),對車企的智能化轉(zhuǎn)型也是一個很好的助力。

天翼云能夠提供人工智能、大數(shù)據(jù)、云計(jì)算一體化的全棧服務(wù),在視頻、存儲、網(wǎng)絡(luò)、安全、運(yùn)營、運(yùn)維等方面,都可以為汽車的研發(fā)、制造、供應(yīng)鏈、營銷以及汽車安全、車聯(lián)網(wǎng)、智能駕駛等領(lǐng)域提供強(qiáng)大的數(shù)字化賦能的汽車行業(yè)平臺,我們內(nèi)部已經(jīng)搭建并且正常運(yùn)轉(zhuǎn)。

強(qiáng)大的算法能力高效地實(shí)現(xiàn)了數(shù)據(jù)和算力的供需匹配,在自建算力的同時(shí),天翼云發(fā)揮了強(qiáng)大的算力調(diào)度能力。我們通過算力的插件和網(wǎng)關(guān)實(shí)現(xiàn)了數(shù)據(jù)的統(tǒng)一調(diào)度和統(tǒng)一接入。在算力接入方面,智算時(shí)代的算力建設(shè)和運(yùn)營有以下三種模式:

一是自建的公共算力平臺可以實(shí)現(xiàn)生態(tài)合作伙伴的引入。目前我們已經(jīng)通過算力平臺實(shí)現(xiàn)了對超過39家的社會閑散算力進(jìn)行公共算力調(diào)度,我們作為國企不能直接做采購和建設(shè)這類算力,但是通過與生態(tài)伙伴的合作已經(jīng)接入了22EFLOPS的算力。

二是可以為行業(yè)搭建算力網(wǎng)絡(luò)。國資監(jiān)管平臺以及高效的算力聯(lián)盟都是已經(jīng)落地的應(yīng)用,形成為行業(yè)搭建算力的網(wǎng)絡(luò)。

三是我們與很多地方政府合作,目前已經(jīng)落地了深圳、貴陽、蘇州、揚(yáng)州等城市。政府成立了很多算力平臺公司,通過使用天翼云平臺一體化的智能調(diào)度服務(wù),真正實(shí)現(xiàn)了“東數(shù)西算”,將很多分散算力進(jìn)行集中統(tǒng)一調(diào)度。

這三種模式是現(xiàn)階段應(yīng)用得比較成熟的算力調(diào)度,實(shí)現(xiàn)算力和數(shù)據(jù)高效匹配的應(yīng)用落地。

在做算力基礎(chǔ)設(shè)施建設(shè)以及智算平臺研發(fā)的同時(shí),天翼云內(nèi)部也有專業(yè)的機(jī)構(gòu)正在進(jìn)行AI、大模型的實(shí)踐。在人工智能時(shí)代,AI大模型算力推進(jìn)的落地也遇到了實(shí)際的挑戰(zhàn):

一是大算力挑戰(zhàn)。眾所周知,一個萬億參數(shù)規(guī)模的大模型至少需要6000卡乃至萬卡的規(guī)模,大模型非常消耗算力。二是更高的性能需求。大規(guī)模的分布式訓(xùn)練面臨著算力、存儲、網(wǎng)絡(luò)等各個方面的挑戰(zhàn)。三是更高的穩(wěn)定性。我們通過并行的存儲和低時(shí)延超大規(guī)模的應(yīng)用,穩(wěn)定性達(dá)到了業(yè)界領(lǐng)先的水平。

天翼云通過對AI框架進(jìn)行升級和存儲的加速,實(shí)現(xiàn)了文件30秒保存和10分鐘加載;通過對多項(xiàng)指標(biāo)的監(jiān)控分析,實(shí)現(xiàn)了90%故障可以在訓(xùn)前被發(fā)現(xiàn)。實(shí)際運(yùn)行過程中,最長連續(xù)運(yùn)行了155個小時(shí)沒有中斷,中斷之后恢復(fù)的時(shí)間也控制在了15分鐘左右,并且長期高頻運(yùn)行也超過了一個月的時(shí)間。智算平臺、智算體系不是簡單萬卡的堆疊,而是通過實(shí)踐的復(fù)雜的系統(tǒng)工程。

一站式的服務(wù)能力有效地解決了訓(xùn)練的工程復(fù)雜、效率低下、中斷頻繁的問題。在訓(xùn)練工程復(fù)雜的方面,通過預(yù)制一些行業(yè)的數(shù)據(jù)級,支持國內(nèi)外的主流AI加速卡;通過預(yù)制大模型,實(shí)現(xiàn)了在平臺上進(jìn)行模型訓(xùn)練就是簡單的選數(shù)據(jù)、選硬件、選機(jī)模,完成以上三個動作,行業(yè)大模型就可以順暢推進(jìn)了,由此解決了訓(xùn)練部署工程比較復(fù)雜的技術(shù)難題。

在訓(xùn)練效率低下方面,通過自研的AI框架實(shí)現(xiàn)了3D并行處理以及加速的算子庫和容器的調(diào)優(yōu),訓(xùn)練效率提升了50%。通過模型的量化壓縮以及自研的AI推理加速框架,推理效率提升了28%,這是通過內(nèi)部的專業(yè)團(tuán)隊(duì)實(shí)踐得出的數(shù)據(jù)。

在中斷頻繁方面,通過硬件解決了故障率高的問題。在大模型訓(xùn)練過程中,高能耗的同時(shí)進(jìn)行高速運(yùn)行,故障率是不可避免的。經(jīng)過平臺的調(diào)優(yōu),實(shí)現(xiàn)了1分鐘檢測、5分鐘定位和1分鐘告警。具有全鏈路的監(jiān)控使中斷的過程做到了可視化,業(yè)務(wù)的預(yù)警也可以提前告知。一站式的服務(wù)大大地降低了大模型應(yīng)用和開發(fā)的門檻,車企未來在大模型的應(yīng)用推廣方面也可以深入探討和實(shí)踐。

運(yùn)營商是一個中立、開放的平臺,我們不會綁定某一條技術(shù)路線,我們打造的是一個開放、共融的生態(tài)。在貴州的大數(shù)據(jù)峰會上,基于大模型的開發(fā)者社區(qū)正式上線了,這個社區(qū)是剛剛才推出的,我們對它的希望是打造成國內(nèi)領(lǐng)先的AI開放的開發(fā)者社區(qū),讓我們拭目以待。

云電腦是在云上領(lǐng)域應(yīng)用比較常見的應(yīng)用落地形態(tài),在AI智能時(shí)代把云電腦進(jìn)行了升級,將AI助手、AI空間、AI客服、AI低代碼等都接入了最新一代的AI云電腦。

我們還打造了算數(shù)融合的套餐,一方面我們有算力、有平臺,另一方面我們也有高質(zhì)量的數(shù)據(jù),同時(shí)也會跟行業(yè)的數(shù)據(jù)進(jìn)行拉通,這樣可以提供文本、圖片、音頻、視頻等優(yōu)質(zhì)的數(shù)據(jù)源,為車企提供一攬子的算數(shù)融合的套餐式的服務(wù)。

以上的介紹是簡明扼要地把天翼云成立十幾年以來的應(yīng)用實(shí)踐。天翼云作為國家云,將攜手汽車行業(yè)和生態(tài)伙伴,為車企的數(shù)字化應(yīng)用、數(shù)字共生賦能,共同開創(chuàng)數(shù)字經(jīng)濟(jì)的新未來。

我的演講到此,謝謝大家!

責(zé)任編輯:李秀枝
后發(fā)表評論
信息咨詢
請輸入11位手機(jī)號

×
登錄
注冊
忘記密碼