上一篇【AI Stack 101】文章中,我們提到了「AI Stack」這個人工智慧靈魂組成的結構要素,同時也比較了過去和現在在建構AI的過程中會遇到的不同問題。今天就讓我們來談談從電腦的計算到人工智慧機器學習的演進過程,也進一步探索AI Stack的組成以及商用的軟體如何輔助我們建置AI Stack。 模仿遊戲 電影<模仿遊戲>中描述了圖靈及其團隊在二戰分秒必爭的情況下,拋棄以往人工解密的方式轉而依賴科技,最終成功完成任務的過程。而當中也多少透露了圖靈在那個年代所擁有的展望和抱負。 20世紀的模仿遊戲中,人們看見了科技未來的可能性。 21世紀的模仿遊戲中,人類能不能將其運用,互相成就? 機器究竟能不能思考?(Can machine think?) 20世紀中期,有著人工智能之父的圖靈便提出了這個問題。至今仍有許多人為此爭論不休。在反覆驗證對方是人還是機器的試驗中,人類也不能避免的去猜想機器是否會透過模仿人類的反應而誤導人類的認知。機器人的反噬等等倫理議題也一度成為人們熱烈討論的未來趨勢。然而,後續電腦的發明也啟發了人類透過依賴機器更輕易的達成任務的理想。當今社會中,科學家和企業家們也不遺餘力地想讓機器們透過機器學習(machine learning)來達到全自動化輔助人類解決問題,邁向更優質生活品質的最終目標。

【AI Stack 101】21世紀的模仿遊戲
【AI Stack 101】21世紀的模仿遊戲

上一篇【AI Stack 101】文章中,我們提到了「AI Stack」這個人工智慧靈魂組成的結構要素,同時也比較了過去和現在在建構AI的過程中會遇到的不同問題。今天就讓我們來談談從電腦的計算到人工智慧機器學習的演進過程,也進一步探索AI Stack的組成以及商用的軟體如何輔助我們建置AI Stack。

模仿遊戲

圖取自電影<模仿遊戲>劇照

電影<模仿遊戲>中描述了圖靈及其團隊在二戰分秒必爭的情況下,拋棄以往人工解密的方式轉而依賴科技,最終成功完成任務的過程。而當中也多少透露了圖靈在那個年代所擁有的展望和抱負。

20世紀的模仿遊戲中,人們看見了科技未來的可能性。
21世紀的模仿遊戲中,人類能不能將其運用,互相成就?

機器究竟能不能思考?(Can machine think?)

20世紀中期,有著人工智能之父的圖靈便提出了這個問題。至今仍有許多人為此爭論不休。在反覆驗證對方是人還是機器的試驗中,人類也不能避免的去猜想機器是否會透過模仿人類的反應而誤導人類的認知。機器人的反噬等等倫理議題也一度成為人們熱烈討論的未來趨勢。然而,後續電腦的發明也啟發了人類透過依賴機器更輕易的達成任務的理想。當今社會中,科學家和企業家們也不遺餘力地想讓機器們透過機器學習(machine learning)來達到全自動化輔助人類解決問題,邁向更優質生活品質的最終目標。

21世紀的人工智慧已經邁向了新的里程碑。

從2011年IBM的計算機系統Watson 在智力競賽節目贏得比賽冠軍,到2016年Google Deepmind推出的AlphaGo以4:1的佳績戰勝韓國圍棋冠軍,AI 已經在不知不覺中進入我們的生活留下深刻足跡,也進一步拉開第四波工業革命的序曲。

人工智慧在21世紀能做到什麼?

人工智慧在這個時代已經於各個方面都有顯著的表現。舉例來說,每天早上解鎖手機的人臉辨識、上班途中音樂軟體自動推薦符合喜好的音樂、中午外送程式根據過往訂餐推薦的餐點,都是透過大量數據所計算出的服務。在大環境中也不乏這類的案例,近年來無論是在政府政策的制定,亦或是各企業的管理研發都逐漸引進了AI 的技術,讓人類的生活更加便利也節省了反覆嘗試的時間。

人工智慧在21世紀成為了一個不可忽視的力量。這些軟體不僅僅是推算的工具,其重要性也隨著科技的開發與日俱增。人類也因此賦予它們更高的期待,透過與AI的合作一同面對氣候變遷、環境污染和新型疾病等等議題的可能性也成為了大眾對未來AI發展的憧憬之一。

AI Stack扮演的角色 — 為這場遊戲注入靈魂

AI Stack 於此同時,扮演著每一個人工智慧背後的重要角色。

--

--

近年來,人工智慧(AI)的蓬勃發展,大大改變了你我的日常生活。隨處可見的相關應用實例,再再顯示了各行各業都正在迎接一波新的數位轉型。而其中,台灣各大金融公司在人工智慧方面的投資、研究以及應用,都將對產業造成大規模的影響和衝擊,過往需要許多人力物力維持的工作範疇,如今藉由人工智慧的研發成果,便能達到一定程度的節省成本,同時也能進一步開發更多優化客戶體驗之嶄新功能,使企業更接近客戶,達成雙贏的理想局面。 駐足人工智慧,國泰金控開展科技新方位 舉例而言,在2021年,國泰金控對於人工智慧的發展就下了許多功夫。他們正朝著「以金融為核心的科技公司」目標邁進,致力推動數位轉型,將創新科技應用在各種數位產品與服務上,透過數位、數據、技術三大主軸打造數據驅動的文化。而為了加速創新速度,國泰金控在2019年啟用「國泰金融創新實驗室(Cathay Financial Innovation Lab)」,並在2021年開展其所研擬之二期企劃,與國泰金控數位數據暨科技發展中心(簡稱數數發中心)共同攜手國泰人壽、國泰世華銀行、國泰產險等子公司共同推動10項金融科技概念性驗證(Proof of Concept,PoC),截至目前已完成至少8項技術驗證,包含了「智能法規解讀」、「智能人臉測量健康數據」、「智能體態量測」等等,應用場景涵蓋金控、人壽、銀行、產險等子公司,足以顯示國泰金控正在嘗試將人工智慧的開發、研究和企業合作引入各大產業領域,以加速完成數位轉型的最終目標。

【金融AI】人工智慧新世代,為金融業注入新生命
【金融AI】人工智慧新世代,為金融業注入新生命

近年來,人工智慧(AI)的蓬勃發展,大大改變了你我的日常生活。隨處可見的相關應用實例,再再顯示了各行各業都正在迎接一波新的數位轉型。而其中,台灣各大金融公司在人工智慧方面的投資、研究以及應用,都將對產業造成大規模的影響和衝擊,過往需要許多人力物力維持的工作範疇,如今藉由人工智慧的研發成果,便能達到一定程度的節省成本,同時也能進一步開發更多優化客戶體驗之嶄新功能,使企業更接近客戶,達成雙贏的理想局面。

駐足人工智慧,國泰金控開展科技新方位

舉例而言,在2021年,國泰金控對於人工智慧的發展就下了許多功夫。他們正朝著「以金融為核心的科技公司」目標邁進,致力推動數位轉型,將創新科技應用在各種數位產品與服務上,透過數位、數據、技術三大主軸打造數據驅動的文化。而為了加速創新速度,國泰金控在2019年啟用「國泰金融創新實驗室(Cathay Financial Innovation Lab)」,並在2021年開展其所研擬之二期企劃,與國泰金控數位數據暨科技發展中心(簡稱數數發中心)共同攜手國泰人壽、國泰世華銀行、國泰產險等子公司共同推動10項金融科技概念性驗證(Proof of Concept,PoC),截至目前已完成至少8項技術驗證,包含了「智能法規解讀」、「智能人臉測量健康數據」、「智能體態量測」等等,應用場景涵蓋金控、人壽、銀行、產險等子公司,足以顯示國泰金控正在嘗試將人工智慧的開發、研究和企業合作引入各大產業領域,以加速完成數位轉型的最終目標。

專案實例,引領AI發展與驗證

在人工智慧的實際應用專案上,以前述的「智能法規解讀」技術驗證為例,國泰金控選擇與台灣法律科技新創Lawsnote(七法)合作,透過自然語言處理(Natural Language Processing,NLP)與向量分析等技術,進行解讀外部法令、函文解釋與設置公司內部規範、標準作業程序等工作內容,接著建立起內外部法規之間的關聯性,進一步作為內部流程優化與自動化串接的基礎,以因應外規變動、數位轉型業務的需求,同時也能輔助法遵業務的執行。另一方面,由國泰人壽與加拿大新創NuraLogix合作的「智能人臉測量健康數據」,以及與新加坡新創BCT合作的「智能體態量測」兩項技術驗證成果中,皆透過非接觸方式,讓客戶不需透過穿戴式裝置也能使用手機前鏡頭偵測重要的身體數值(如:呼吸、心跳、血壓、壓力等),協助客戶追蹤健康狀況及提升風險意識。

此前兩項概念驗證結果的精準度與客戶滿意度皆達到一定水準。以上的研究成果都為國泰金控帶來了許多益處,同時也能大幅度的提高用戶體驗,人工智慧的重要性和創造力即在案例中可見一斑。在以上的大項目AI發展之外,針對其他內部的人工智慧應用,國泰金控同樣多點開花,在各大子公司分別進行著許多不同方向的研發,其中包括AI投資模型研發、智能選股模型、智慧客服、智能金融語音助理、金融產品智能推薦服務、智能後勤服務平台建置、AI影像辨識應用等等,都是國泰金控對於內部AI開發著重的專案項目。

AI Lab定調方向,中信金先馳得點

除了國泰金控之外,中信金控在人工智慧的發展上也投注了非常多心力。2016年,中信金控成立「人工智慧AI Join Lab」,並採取「數位轉型」、「數位創新」、「數位基礎建設」3軌並進的數位轉型工程,為其未來的人工智慧研究企劃打下紮實地基。2018年1月,中信金控接著成立了數位研究發展中心,打造「中信腦」研發計畫,定調電腦視覺、自然語言處理、機器思考等3條研發路線,成立3大實驗室,針對精準行銷應用、市場預測引擎、文字與文件辨識應用、人臉與物件辨識應用、機器閱讀應用、機器對話應用等6大AI應用核心進行聚焦研發,再由核心應用推展延伸,勾勒出行銷溝通、客戶體驗、流程優化、風險控管等4大應用場景,後續目標可再搭配實際應用案例,一步一腳印漸漸地實踐AI落地,落實最終構想。

同年5月,新一代行動銀行「中信Home Bank」上線,首創語音轉帳功能,且用戶可使用指紋辨識、圖形鎖、臉部辨識等功能直接登入系統;同年12月,中信銀行進一步推出「智能ATM」,可用臉部辨識提款、偵測異常交易行為,以及透過智能影像分析提供精準行銷的個人化廣告推播功能。隔年(2019年)4月,數據研究發展中心打造出一套人臉辨識引擎,並取得美國國家標準暨技術研究院NIST認證,其辨識準確率為全球金融業第一。2019年11月,中信銀行在臺北金融科技展發表多項創新成果,包括自動辨識支票的「AI存票機」、整合人臉辨識與NLP技術的「對話式ATM」,及「刷臉支付智慧餐飲系統」。

由上述資料可知,中信金控對於數位轉型的即早研發具備相當高的敏銳度,早在2016年便成立實驗室,並自2018年開始,陸續達成各項不同AI專案的落地,將研發項目轉換為實際業務績效。直到2019年末,中信金控在AI方面的發展程度已具有相當的成熟度,也為隨之而來快速的社會發展和數位轉型需求做好了相應的準備。

單位拓展與實例應用,落實AI落地目標

2020年,中信銀行成立「科技金融發展中心」,由數據暨科技研發處、全球資訊管理處、數位金融處3大處級單位共同組成,統籌發展與推動全金控科技金融策略,同時將中信Home Bank行動銀行App升級,推出AI對話式語音服務,用戶透過語音助理「小B」對話就能完成轉帳、查帳,再度升級了客戶服務品質。到了2021年,中信金控推出中信腦3大類AI應用場景:「營銷經營+AI」、「流程優化+AI」、「風險控管+AI」,並且在業務單位落地AI專案已達成超過20個。以上各項研究發展成就,除了展現中信金控在AI科研企劃的執行力和創造力,更是具體呈現了進行AI開發對於產業的重要性,尤其在金融業以客戶服務為利基的前提下,能夠加強服務品質與有效服務資源利用,再到進一步優化客戶體驗,都會是金融業在面對數位轉型的大環境趨勢下,在自身企業建立巨大競爭優勢的堅實地基。

玉山金AI引航,助力提升服務價值

另一方面,人工智慧的拓展對於玉山金控而言,也是掌握先機的發展方向。早在2006年,玉山金控就開設了大數據分析團隊CRV(Client’s Risk &Value),瞄準顧客風險價值,來探勘既有的客戶KYC(Know Your Customer)資料,更細緻地將客戶分群。到了2013年,CRV更朝資料科學應用發展,開始將資料分析成果運用於數位業務,還要從更大量、動態變化的數據中,挖掘有意義的洞察。2015年,玉山創新發展中心(Innovation Development Center,IDC)誕生,用以研究AI、區塊鏈等技術,而原本的CRV則繼續專攻大數據分析。到了2017年初,玉山金控成立創新實驗室(Innovation Lab),來研究區塊鏈、AI、身分辨識、電子支付、大數據和AR/VR等六大前瞻性技術,同時在實驗室下設立研發、商轉、顧問和育成四大中心,拓展技術人才資源布局。但是,對於玉山金控而言,改變的腳步並未停下、也不能停下。

2018年,玉山再次調整方向,這一次,他們打破臺灣金融界先例,成立科技長辦公室(CTO Office),找來已故臺灣人工智慧學校執行長陳昇瑋擔任科技長,協助加速金融科技研發和落地。而陳昇瑋科技長在上任後,隨即與產學討論,確認AI能改善商業模式和獲利模式,因此決定全力發展金融AI。這個決定,定調了屬於玉山金控的科技發展藍圖,讓玉山過去十多年來科技實力的積累有了嶄新的方向。自此,玉山金控對AI策略的重視程度不言而喻,他們在2019年成立了智能金融處(智金處),作為「內部AI供應商」,把不同方面的AI技術,打造成一套內部專用的AI服務產品,讓各單位可以自行運用,並用以實踐AI藍圖。此部門由科技長出任處長,指揮團隊建置AI底層架構、開發AI系統。而CRV也功成身退,轉型為智金處來推動金融AI服務的使命。到了2021年,智金處改組,將原智能分析部改為智能服務部,以強調服務落地,下設智能應用科、智能風險科及智能應用科;並新增智能企劃部,負責服務落地的相關法遵風管等議題;智能系統部持續承接系統開發與平臺建置等任務。

智能金融起步,邁向嶄新科研階段

玉山金控在技術發展的投注方向與其組織轉型一直息息相關,從數十年前的大數據分析團隊CRV,一路改組轉型到現在的智金處,在這個過程中,他們歷經了從商業洞察提供者、到資料加值提供者、再到模型服務提供者的定位轉換,在每個時代都被賦予不同的角色和使命。在這樣的背景之下,針對智金處的發展和投資絕對至關重要,更催生了許多人工智慧的相關專案以及客戶服務產品。玉山金控對智金處充滿期待,他們寄予厚望,竭力輔助智金處成為玉山金融科技發展的主力,甚至亟欲將其進展為玉山第三個十年目標「科技的玉山」之核心推手,達成「以科技帶領所有業務」的全新階段性目標。

金融業爭相佈局,展望未來AI版圖

由上述案例可知,台灣在地金融業對於人工智慧的進程和發展可以說是充滿了期望,在AI肉眼可見大幅度進展的未來,各大金融業對於AI的前瞻性和實際應用案例將帶領著產業成功且順利地走向完整的數位轉型,引起新一波的人工智慧風潮。

【參考資料】

--

--

隨著高效能運算(HPC)的平均成本大幅下降,混合雲的應用也逐漸普遍,人工智慧協助醫療人員改善臨床醫療,已經是相當普遍的現象。其中協助判讀 X 光、超音波、核磁共振等醫療影像是人工智慧最拿手的領域之一。

醫療影像與其他影像資料相比,有其特殊性:醫用影像具有高度私密性,但醫師又需要與醫學社群持續保持交流;檔案龐大且複雜,高度專科化;格式特殊,需要由特定的程式處理等等,都阻礙了人工智慧應用在醫療影像上的步伐。為此,NVIDIA 與倫敦國王學院合作開發的 「MONAI」醫學影像人工智慧平台因應而生,希望能加速人工智慧判讀醫療影像的技術研發速度。

MONAI 的核心架構

MONAI:醫療用人工智慧開放框架

MONAI (Medical Open Network for AI) 是 NVIDIA 專為醫療和生命科學設計的人工智慧 NVIDIA Clara 下的一款應用框架。MONAI 是以 PyTorch 為基礎所開發的開源框架,希望能專注在處理醫療影像資料、提升訓練 AI 的效率,以及導入可複製的參考實施 (reference implementation)。開源的程式碼也讓研究人員能夠有高度靈活度,能夠自行優化人工智慧的訓練模型。

目前 MONAI 已經公開二十個獨立的模組(數量還在增加中!),例如專門用來判讀 COVID-19 患者胸部 X 光的人工智慧模型。由於 MONAI 為開放原始碼的平台,醫學社群已經協助將這些模型,針對醫療影像資料標準格式,進行了調校,讓後續的醫療研究者能夠更快進入研究核心。

舉例來說,醫療影像的格式(例如DICOM),往往是多維度的原始資料,包含像素狀態、影像屬性等參數,來自不同機構的原始資料,在處理前也需要進行大量前處理、校正與訊號強化。MONAI 模組化的設計,讓研究者可以將所有流程在 MONAI 上完成,也可以只取用部分模組,降低學習曲線。

MONAI在放射科的應用:更強大的自動標記系統

--

--

人工智慧 (Artificial Intelligence, AI),為了理解人類而生。

AI 的運用範圍涵蓋各個領域,也成為各企業數位轉型的轉捩點。【AI Stack】在這個重要的時刻便不容置喙的扮演著重要角色,它像是一個工具箱搭載了AI所需的所有能力,透過開發者及其自主系統不斷增強實力,隨時準備好成為人類的第一副手!

人工智慧對現代的重要性

在資訊量爆炸的年代,人工智慧的發展逐漸成為各行各業爭相角逐的領域。而擁有一個成熟的人工智慧技術可以協助公司減少不必要的人力資源消耗,並讓制定決策、評估風險等等工作達到更系統化的組織。

如何建構一個完整的AI Stack?

過去建構技術堆疊時,開發部門無非著重於兩大要件,資訊系統的基礎架構 (infrastructure)以及完善的開發環境 (development environment )。開發人員之所以要仰賴技術堆疊是因為它可以傳達應用程式建構的大量資訊,這些資訊可以進而被運用在應用程式後續開發維護和人才招募時的條件設定。然而,也因為在各種程式語言及技術快速更迭的時代,讓每個應用程式背後都有屬於自己的特性,傳統的開發模式也面臨了許多限制:

  1. 開發人員偏好的程式語言侷限了程式的視野(舉例來說熟悉JAVA的工程師會傾向製作手機軟體而忽略了目標群眾多為桌機用戶的可能性)
  2. 未來不可控性可能導致資金分配不均而後續開發跟維護受到限制

在這樣的趨勢下造就了AI 開發的繁榮。卡內基美隆大學便針對於AI Stack 的建立,完整規劃了10 個區塊。

AI Stack組成十大要件 (資料來源:CMU AI)

1. 自治權(Autonomy)

自治權指的是AI單獨做決策的能力,成熟的AI甚至可以比人類還要早發現問題並解決。舉例來說,無人駕駛車對於意外事故的反應會比人類快得多。

2. 互動性(Human AI interaction)

良好的互動性可以讓AI更加貼近並增強人類的能力。過去要透過人工看護的工作現在可以透過機器監察病人來精準判斷是否需要人為協助。

3. 策劃與行動(Planning & Acting)

策劃和行動的重要性在於優化、安全保固、知識網路儲備和戰略推理並且使最佳解具象化。同時也要能針對開發者所給的資料進行分析和吸收。

4. 決策輔助(Decision Support )

AI除了自主決策外也可以提供分析資料和建議去輔助使用者制定決策。常見的使用會在人力資源的分配,像是如何建立一個最有效率的團隊解決痛點等等。

5. 模型建制(Modeling)

AI系統會仰賴電腦分析資料來學習新資訊。透過電腦所建構跟模擬的現實情境來提供AI學習情境。

6. 機器學習(Machine learning)

機器學習分為三個階段:接觸預設情境、反覆測試以及應用。而透過不斷地接收新數據跟模擬不同情境,AI便可以不斷精進他的演算能力提供最好的解決辦法。

7. 巨量資料管理(Massive data management)

AI 的學習過程中會接觸到數以萬計的資料,因此如何去管理並妥善運用也成為了建構AI Stack 重要的課題。

8. 設備(Devices)

設備即是讓AI能有效感受環境並分析後傳達資訊的設施。知名的Iris recognition system便是運用技術在40公尺的距離外進行生物虹膜辨識。

9. 運算(Computing)

所有的AI都是建立在龐大的運算。這包括了不同的ML平台像是TensorFlow、程式語言、執行系統以及所有能讓AI學習的不同裝置間的互動。

10. 倫理(Ethics)

依賴AI可以讓人類的生活更加便利,然而人類在建構AI Stack 的過程中仍不能為了達成目的忽略道德問題。因此,要建構一個對人類未來發展有益的AI,開發者及其倫理的重要性不容小覷。

一個完善的AI Stack 就是透過十個區塊的互相合作建立而成,AI開發者一旦忽略任何一個環節都可能讓原本既定的道路遇上阻礙。因此,不同部門間良好的溝通合作也成為近代AI開發的決勝點。

數位無限 AI-Stack 能為你做什麼?

近年來AI的應用市場逐漸擴大,GPU的市場需求高速增長,如何去妥善運用稀缺的資源便成為各企業面臨的下一個挑戰。同時,耗時長、成本昂貴等痛點導致建立準確率高的AI模型難度提升,低效率且雜亂無章的營運管理模式成為了現代企業數位轉型難以解決的問題。

--

--

今年五月,全世界研究人工智慧的學者和藝術家,紛紛都為一個能夠生成細膩作品的人工智慧感到驚艷,這個服務稱為 Midjourney。使用 Midjourney 完全不需要具備任何電腦科學或是藝術創作的深厚背景知識。只需要輸入一段文字,接下來等待 Midjourney 的人工智慧算圖即可。

令所有人最訝異的是,Midjourney 和之前的生成式藝術 AI 所產生的作品並不相同,Midjourney 不但能夠某種程度地消化自然語言的含意,甚至會加入某些「合理化的情境」,看起來就像是非常資深的畫家,在理解了作畫目的之後,所畫出來「有意識」的作品。而且速度相當快,1 分多鐘就可以生成使用者想要的作品。

人工智慧將取代藝術家?

其實人工智慧嘗試藝術創作並非新點子,早在 2018 年,法國藝術家聯盟「Obvious」,便撰寫了演算法,生成名為《艾德蒙・德・貝拉米》(Edmond de Belamy)的作品。Obvious團隊在線上藝術百科 WikiArt 上蒐集了15,000幅14世紀到19世紀的圖像,並輸入到 GAN(Generative Adversarial Network,生成對抗網路) 中進行計算。總共創造了11幅作品,其中有一幅甚至在佳士得拍賣會上,以一萬歐元的價格賣出。但此時的畫作品質還非常粗糙,也屬於模仿風格的程度,並不能選定特定主題。

美國羅格斯大學(Rutgers University)的 Ahmed Elgammal 教授也設計了 AICAN(AI Creative Adversarial Network,創造性對抗網路)來產生全新的創作。和之前使用 GAN 的做法不同,AICAN學習了藝術史中的所有風格,消化之後生成一個全新的風格。

2021 年,一家名為 Wombo 的新創公司,推出了名為「DREAM」的 APP。這款 APP 能夠讓使用者輸入特定的關鍵字,接著選定風格,大約30秒左右的時間就能生成一張唯一的畫作。即便再次輸入同樣的關鍵字和風格,也不會出現一樣的結果。此時的作品意境還相當抽象,還是可以看得出並非人類畫家的作品。

--

--

作者:張達元

圖來自 A Survey on Federated Learning: The Journey From Centralized to Distributed On-Site Learning and Beyond

更貼近生活、注重隱私且強大的機器學習服務是否能產生?聯邦式學習包含什麼概念?聯邦式學習帶來什麼好處?聯邦學習的概念正試圖突破我們對機器學習的想像。

所以什麼是聯邦學習?

聯邦學習(也稱為協作學習)是一種機器學習技術,有別於傳統的中心化機器學習需要在訓練時將所有相關資料集中到同一個計算裝置進行訓練產出模型,聯邦學習欲達成多裝置可在不需要傳輸訓練資料的前提下協同完成機器學習模型訓練。這項技術是google在2016年為了解決google keyboard擁有來自多個android手機資料的機器學習模型而提出的。

--

--

2022 年 Computex 上可以觀察到,雲端運算與人工智慧如今在各個產業都備受重視,從自動駕駛到自然語言的辨識,都需要人工智慧的參與。

人工智慧可以藉由演算法,從過往的數據中學習,找出數據的特定模式,並隨時配合新輸入的資料做出調整與回應,以模仿人類的思考與行為模式。而高效率的人工智慧,必須高度仰賴對資料庫的管理,沒有好的資料,或是資料沒有妥善的管理,資料終究只是一堆無用的數據,無法產生應有的價值。

因此「數據治理」(Data Governance) 是現代化企業相當重視的管理邏輯之一。

甚麼是數據治理

根據定義,數據治理指的是在兼顧資訊安全的前提下,讓數據保持高度準確性、可近性與易用性的各種管理策略。每一個企業,都可能有獨一無二的數據治理策略,以確保在收到大量營運資訊之後,能夠好好地應用。

以電商為例,許多電商在每日的營運中,自然會累積大量的顧客數據。一個沒有導入數據治理的公司,可能收集到許多重複、無效的會員資料。未經清洗和處理就放進客戶行銷平台中,很有可能會重複地濫伐行銷訊息,反而造成客戶反感,傷害品牌形象。業務端也可能因為虛胖的會員數量,對於實際的業務量總是無法掌握。

執行數據治理前:統整數據結構與使用方式

數據治理是需要企業跨部門合作的事情,並非是資訊部門要負責,也不是業務或行銷部門要主導的事情,需要各部門一同協作,能打破數據的孤島。

最常見的方式就是每一個業務部門負責處理特定的幾項數據,擁有數據的負責人要確定該項數據可以被清楚定義、標準化並向其他的同仁說明,並在共識會議上,確認這些數據,在整個公司內有唯一的明確定義。一般而言,數據的負責人也具有管理數據分享權限的權力。統整了數據的結構,才能夠有統一的語言讓數據用同樣的方式被收錄到數據庫中。

導入雲端數據工具:兼具成本與效益

隨著雲端運算的普及,越來越多的數據工具都可以在雲端執行。對於企業來說,將雲端運算和雲端的數據工具導入數據治理中,越來越普遍。例如龐大且複雜的通用型 AI(Generalist AI),就很大程度地仰賴了雲端架構。

對於許多中小企業而言,為了享受雲端的便利,完全仰賴一己之力,建構所有的硬體與軟體越來越不實際。公有雲能提供許多資料科學工具或人工智慧模型,私有雲則保障了資料的私隱性。整合公有雲與私有雲,能夠自由調度資料的混合雲模式,能夠有效控制成本,提升效益,更是中小企業導入人工智慧時最好的數據治理策略之一。

未來每家企業都是科技業,數據將是產生商業價值的基本來源。企業在日常營運中不斷累積的資料庫,訓練人工智慧模型挖掘有意義的重要資訊,是未來幾年的重要趨勢。運用正確的工具,做好數據治理,將會是每個企業相當基礎的管理工作。

--

--

根據市場調查機構 Futuriom 的研究(2020 Futuriom MDN Survey),混合雲與多重雲已經成為全球趨勢,超過八成的受訪企業都已經採用混合雲的架構。不只是科技和醫療產業,對日益興盛的電子商務和零售服務業者,選擇適合企業的雲端服務,是讓企業更容易運用資料的必要工具。

混合雲(Hybrid Cloud)是甚麼?與公有雲與私有雲有甚麼不同?

根據美國國家科學會NIST的定義,混合雲(Hybrid cloud)是由兩個或更多雲端系統組成的雲端基礎設施,這些雲端系統包含了私有雲、公用雲、社群雲等。混合雲因為同時具備公有雲和私有雲的優勢,所以這些年吸引了大量的企業開始依據自己的需求,過渡到結合兩種方式的混合雲端服務。

常見的公有雲服務指的是像 Google Cloud Platform, AWS,阿里雲等服務,雖然因為不須購買實體伺服器、不須聘用專業管理人員,所以能夠大幅降低成本。可是如果公司所有的數據皆仰賴公有雲,那麼表示資料全部皆須上傳雲端,過程中洩漏資料的風險相當高。

使用私有雲作為公司資料的共享架構,雖然私隱資料外流的機率大幅降低,但是要自行管理完整的系統並聘用專業管理人才,使得維護成本相當高昂,對於很多也想使用雲端服務,但成本管控較嚴格的中小企業來說,並不適用。

--

--

在現代工業領域中,如果想要快速地進行轉型,有三個相當重要的因素。第一是採用工業 4.0 的思維,並將此思維融入作業流程與設計原則中;第二是採用高度自動化、無人化的智慧工廠;第三就是建立新世代的數位孿生(Digital Twin) 系統。這三點是近年來在工業領域最重要的未來發展。

其中建立數位孿生系統並不是全新的概念,但一直是相對較為繁瑣的環節,自然也吸引了人工智慧專家的興趣。傳統的數位孿生系統,虛實整合的程度較低,許多決策還是比較仰賴專業人力判斷。如今,相對平價的高速計算、虛擬實境設備與IoT物聯網的技術已經漸趨成熟,工廠管理者和人工智慧共同參與決策,已經是可以實際應用在產線上的技術,那麼如何建立科學和物理上精確的數位孿生系統,便是相當重要的基礎工作。

NVIDIA 近日更新了 NVIDIA Modulus ,目前版本來到 22.03,展示了現今最進步的物理運算神經網路模型。這次的更新,讓開發者能夠使用更細膩的物理模擬之外,並加強了與 NVIDIA Omniverse 的整合。

NVIDIA Modulus 是基於 TensorFlow 的應用,並利用 XLA 來最佳化效能。XLA 是一種線性代數的編譯器,已經用在許多特殊領域,可以加快 TensorFlow 模型的運作。在訓練好模型之後,NVIDIA Modulus 能即時進行分析。過去這樣的運算,設定好參數後需要完整跑過一次模型,才能進行評估,每次運算都要耗費大量運算資源,相當耗費人力與時間。

NVIDIA Modulus 與 Omniverse 整合後,開發者能夠在以 Python 為基礎的 API 上進行開發,再將開發成果輸出到 Omniverse 中,用視覺化的方案進行開發。開發者能夠享有更大的自由度,對於理解複雜的模型 (例如工廠動線的延續關係) 也會更加直觀。

NVIDIA Modulus 目前支援 FNO(Fourier Neural Operator,傅立葉神經運算子)、AFNO(adaptive Fourier Neural Operator,改良傅立葉神經運算子)、PINO(physics-informed FNO,專門進行物理資訊運算的 FNO) 以及 DeepONet,大幅提升物理運算的真實性。在與西門子合作的智慧孿生工廠範例中,就可以清楚看到套用 NVIDIA Modulus 22.03 後的效果,無論是工廠設施的真實性、液體流動、混合的物理特性,都有顯著提升。

NVIDIA Modulus 現在已經免費開放給全球的開發者,下載連結於此

--

--

NVIDIA 在 2022 年的 GTC 宣佈推出 NVIDIA Riva SDK 2.0 版本,提供全球的開發人員將預先完成訓練的深度學習語音模型和軟體工具,輕鬆地放在各種情境,建立具互動性的對話式人工智慧 (AI) 服務。

NVIDIA Riva 能夠提供高精準度的自動語音辨識,對自然語言的理解能力也很高,還能對多種語言進行即時翻譯,以及全新的文字轉語音等功能,用來建立表達豐富內容的對話式 AI 應用程式。從聆聽、理解到產生回應內容的速度,多數都能夠在 100 毫秒內完成動作,並部署在雲端、資料中心或邊緣裝置,增加更多觸及。

NVIDIA 使用超過十億頁的文字、六萬小時的語音資料,並以不同的語言、口音、情境和專業術語,耗費數百萬 GPU 小時來訓練 NVIDIA Riva 框架。開發者現在就可以從 NVIDIA 的 NGC™ 目錄中挑選一個 Riva 已預先訓練好的模型,用自己的資料與 NVIDIA 遷移學習工具套件對這個模型進行微調和最佳化,好在新的即時語音服務中,提高資訊處理量,並降低延遲。

--

--

InfinitiesSoft數位無限

InfinitiesSoft數位無限

數位無限軟體(InfinitiesSoft)專注於為企業解決虛擬化、容器化、微服務、邊緣運算、混合雲管理、異質IT環境與人工智慧帶來的挑戰,整合異質雲管與熱門的開源AI深度學習架構和開發工具環境,提供一站購足的AI機器學習雲平台方案AI-Stack。