【聲明】港生活網站並無進行電話推廣活動

生成影像AI 模擬真人講課演說 可用於客戶服務與營銷 推廣效果佳

發佈時間: 2023/03/10

大熱的ChatGPT掀起全球對人工智能(AI)工具的憧憬,有初創推出的影像生成AI工具,可以基於真人影像,快速製作朗讀任何內容的影像,支援逾百種語言,可用於教學影片、營銷用途、客戶服務等。

相關技術倘結合ChatGPT等內容工具,未來網課導師、主播,甚至演說家,隨時可以AI影像取代。

網絡進入影片時代,企業無論進行宣傳以至營運,都有可能需要製作影片,但要找人錄音、拍攝,甚至為個別客戶提供客製化的內容,成本不低。以色列初創D-ID聯合創辦人兼行政總裁Gil Perry解釋,企業清楚了解影像的好處,特別是讓參加者更關注內容,提高互動性。

頭部動作不大 模仿口形為主

該企以生成AI(Generative AI)技術,只要輸入影像資料與文字內容,系統分析後便可複製出朗讀者的聲綫,再製作出朗讀該等內容的影像。現時技術主要以模仿口形為主,並未做到更複雜的影像編輯,就記者觀察,因為製作出來的影片頭部動作不大,如果長期觀看影像,可發現不自然之處,但在聲綫與口形上,已不太易看穿影像的真偽。

他指出,平台的需求極高,特別是近日,每5秒便有新帳戶登錄、查詢,而平台至今已生產出逾100萬條影片。

據Perry解釋,該技術現時提供兩種企業服務。基本形式是用戶從一系列指定的「演說者」頭像中選取一個,另行輸入內容,生成出所需的朗讀影片。技術上亦可讓客戶自行安排人員,由該企拍攝影像素材,生成所需朗讀影像。此外,用戶可選擇以API接駁該企平台產生影片,又或自行運用Studio工具管理製作。

他續指現時主要有兩種企業服務需要這類生成影片。首先,網上學習平台盛行,但教學內容量太多,要導師就每一條題目、每一種語言進行拍攝就絕不實際,而運用生成AI的技術便可以生成無數條解說教學影片。

未來用於ATM 家居智能助理

影片亦可用於客戶服務用途,Perry表示,企業客戶服務與營銷上,如能成功提供客製化內容,對客戶關注與留存率的意義重大,而運用生成AI便可以製作懂得朗讀針對指定客戶的推廣影片,包括名字與推介產品等,這種影片的推廣效果,自然比冷冰冰的電郵為佳。

如果進一步結合ChatGPT等內容生成AI,該企技術可以有進一步的潛力,讓企業以「數碼人類」的形式提供各種企業服務,集現時聊天機械人與真人服務的優點。

可行的場景包括作為未來客戶服務平台的基礎,例如ATM、機場服務,甚至家中的智能助理,解決客人的疑難「讓聊天機械人加添一分人味」。內容技術更加成熟時,甚至可作為企業發言人,回答外界對企業的提問,又或就指定議題發表演說。

不過他亦強調,研發技術並非以取代人類工作為目的,例如記者這類職業,對整合消息、尋求真相所表現的職能,AI並不能取代。

新版ChatGPT API 便利企業價格平9成

ChatGPT AI技術近日風靡全球,開發ChatGPT的OpenAI近日乘勢推出新版ChatGPT API,表示可方便任何企業,將ChatGPT技術導入自家的應用程式、網站、產品或服務。價格方面,將比現有的語言模型便宜90%,僅0.002美元(約0.016港元)就可獲得1,000個token(字詞單位)。

可導入應用程式 網站或服務

OpenAI表示,新版ChatGPT API可應用的服務不僅是聊天機械人,該API採用的語言模型gpt-3.5-turbo,與原本的ChatGPT開放模型和新版Bing所使用的並不同,還可用在其他非聊天類別的應用程式。

是次大降價,OpenAI解釋是由於目前已將ChatGPT的使用成本降低了90%,而開發者也可在API中使用OpenAI的開源Whisper large-v2模型,達到更快、更具成本效益的應用成果。

(原文刊《香港經濟日報》)

記者︰周俊霖

美術:顏玉玲