藝教長工互動研究室

藝教長工互動研究室 Always Working Lab由北藝大藝教所陳俊文老師主持,研究重點在互動設計、資訊圖表、地圖、導覽解說媒體設計

17/04/2026
16/04/2026

一名開發者在橫越美國的班機上,靠著機上 Wi-Fi 和 AI 輔助寫程式,把《魔戒》與《哈比人》的中土世界做成了一張可以免費使用的互動式地圖。

這件事聽起來像是書裡才會發生的情節,但它真實存在。這張地圖由 Fraser Marlow 製作,任何人都可以直接開啟瀏覽。功能也相當完整:可以追蹤佛羅多、亞拉岡、比爾博等角色的旅程路線,還能點選超過百個事件標記,涵蓋《精靈寶鑽》到《王者再臨》的重要地點。

旅程路線採用 Catmull-Rom 插值算法繪製成平滑曲線,搭配 Leaflet.js 框架處理縮放與拖曳,技術架構跟 Google 地圖的基本原理如出一轍,操作起來也同樣流暢。Marlow 也坦言,LLM 對托爾金著作的掌握程度讓他真心驚訝,許多細節都能精準挖掘。這個專案也讓「vibe coding」這個詞再度被討論起來。

這個概念由前 OpenAI 共同創辦人 Andrej Karpathy 於 2025 年提出,意思是用自然語言告訴 AI 你要什麼,讓它寫程式,開發者不必深讀每一行程式碼,而是靠測試與對話來推進。批評者認為這樣少了一份親手鑽研的溫度,但 Marlow 說得也直接:他做這張地圖,本來就是為了探索自己深深著迷的傳說年代記,AI 只是讓這件事變得可行。對於熱愛某個世界觀卻沒有時間從零學技術的人來說,這或許是目前最誠實的答案。

https://www.techbang.com/posts/128749-ai-vibe-coding-plane-middle-earth-map

非常重要的標準
30/03/2026

非常重要的標準

經濟部標檢局公布新的國家標準 CNS 16282「圖形符號-一般公共及基本安全圖標」

為回應長期以來臺灣公共場域中圖標設計分散、品質不一且應用困難的問題,『台灣設計研究院』於2023年推動「公共圖標計畫」,邀集相關中央部會及各主管機關,透過系統性的設計研究與標準化推動,成功促成國家標準 CNS 16282「圖形符號-一般公共及基本安全圖標」制定公布,為台灣公共環境建立首套具一致性與國際接軌的公共圖標系統,協助提升公共空間的視認品質與整體服務設計水準。

CNS 16282 國家標準內容涵蓋公共設施、交通設施、旅遊觀光、體育活動、商業設施、公共行為指示、基本安全及無障礙等八大類別,共計253個圖標(圖示),為公共環境提供具參考性與可落實的設計基準。目前已可於經濟部標準檢驗局「國家標準(CNS)網路服務系統」查詢與全文閱覽;同時,『台灣設計研究院』亦提供本標準圖標之開源檔案下載,採 CC BY 4. 0 授權條款,各界可自由分享、修改及商業使用。

國內相關製圖與地理資訊服務、空間規劃與公共資訊服務單位,未來在圖資製作、場域標示與導覽系統建置上,均應關注並適時導入這項新標準,以提升資訊傳達的一致性、辨識性與國際通用性。

公共圖標開源檔案下載:https://www.tdri.org.tw/zh-TW/CNS16282
CNS 16282 國家標準線上瀏覽:https://www.cnsonline.com.tw/?node=result&generalno=16282

24/03/2026

「第三人效應」(Third-Person Effect)傳播理論

理論定義
第三人效應是由美國學者W. Phillips Davison於1983年提出,指人們在接觸說服性媒體訊息時,常高估該訊息對「他人」的影響力,卻低估對「自己」的影響。

這種認知源於自我防衛機制,人們傾向認為「我比別人更有主見,不易被影響」。

核心特徵
認知層面:預期媒體對第三者(他人)的態度與行為影響更大。


行為層面:可能促使個人採取行動,如支持審查媒體,以防止他人受負面影響。

此理論廣泛應用於解釋假新聞傳播、廣告策略及社會運動。

18/03/2026

「這裡是119勤務中心,請問需要消防車還是救護車?」話筒另一端,老人家慌亂顫抖、結結巴巴的用國、台語交錯報案。過去,派案員得在生死交關的幾秒鐘內,一邊安撫、一邊從模糊鄉音中判讀訊息;如今,AI語音辨識系統會同步分析報案內容,當偵測「沒有呼吸、沒有心跳」等關鍵字,系統會紅色警示,預判為OHCA(到院前心肺停止)案件,自動聯動高級救護派遣模組、推播急救先鋒App,通報案件。

這套每天接聽上千通、精準識別國、台、客、英4種語言的救命系統,幕後功臣是長問科技總經理陳又碩,他做的是Google、OpenAI等大廠,明知台灣有需求,卻不願做的「苦力活」。

台灣正面臨無聲卻巨大的「語言斷層」。根據2020年內政部人口普查資料,全台6到14歲的國小、國中學童,只剩下7.4%將台語當成主要溝通語言,客語更慘,跌到0.3%。

「台語在住院中、客語進加護病房、原住民語則在急救中,」致力發展台灣本土語音語料庫、陽明交通大學智能系統研究所教授兼所長廖元甫形容。

「當高科技越發展,低資源的語言越容易『掛掉』。」他指出,目前中國釋出的華語語料庫總時長已達2萬2千多小時,台灣的台語語料庫卻只有300個小時,落差高達73倍。這意味著AI模型辨識中文會遠比台灣國語精準。台灣使用者被迫放棄使用自己的腔調,如果不搶救,未來長者要請照護機器人幫忙倒一杯水,也得說北京腔。

陳又碩是廖元甫的學生。為了替瀕危的本土語言建立語料庫,他們從2018、2019年開始展開一場「數位田野調查」。團隊沒有待在實驗室,而是帶著錄音設備跑遍屏東、台中東勢、雲林崙背等地。

「這不是大廠會做的事,」 陳又碩說。當對手追求規模化、低成本的通用模型時,他們卻在磨最細碎、最難自動化的在地語料,這樣的笨功夫,一磨就是整整一年,直到疫情時,終於被看見。

2020年,疫情指揮中心記者會的語音即時字幕系統,全都採用長問的產品。團隊每天緊盯直播字幕,即時微調模型。他記得:「全台北市街道空蕩蕩,只有同事為了公事,趕到公司。」

兩年後,另一個時刻讓他們更加確信這條路走得對。

2022年,Meta執行長佐伯格為展示AI技術,邀請台灣學者與他以台語對話,背後使用的正是同一套語料庫。「終於可以證明語料庫是有用的,而且還幫忙國庫賺到錢!」廖元甫說。

然而,就在技術開始受到關注時,公司卻陷入最艱難的時刻。連3年虧損、核心團隊出走三分之一。

更大的挑戰來自商業化門檻。2023年,企業若想導入系統,光是採購AI運算的GPU硬體,就需要約500萬元投資。對中小企業而言,這是一道難以跨越的門檻。

為了生存,他沒有放棄,帶領團隊埋首兩年,硬是透過軟體優化,將硬體成本從500萬降至70萬,降幅超過八成五。當導入門檻降低,飛輪才真正開始轉動。醫療院所、金融機構與政府單位陸續採用,包括雙北服務專線1999,以及台北的119指揮中心。

2024年,長問營收開始翻倍成長,公司轉虧為盈。鴻海、台灣大哥大、中華電信與三商電腦等都成為夥伴,一起把本土語AI辨識系統導入更多場域。

「連全球雲端大廠都要找我們處理,我就知道這條路走對了。」他說。

現在,在客語重鎮桃園聯新國際醫院,客家長者看診時不再擔心醫師聽不懂,診間導入語音辨識系統後,螢幕會即時將患者描述轉為中文字幕並對應醫學術語,減少語言造成的醫病誤解。

在公司,陳又碩是帶領團隊打磨技術的總經理;回到家,他卻是焦慮的父親。

「我的孩子讀國、高中,他們只會聽、卻不會說台語了。」他語帶遺憾的說:「會不會有一天,孩子聽不懂阿公說的『吃果子拜樹頭』?語言消逝了,文化也就稀釋了啊。」

這份焦慮,讓他對這份「笨功夫」有了不同的使命:他標記語料,不僅是為了AI準確率,更是為了將來某一天,當下一代想找回自己的文化根基時,數位世界裡還留有最道地的素材,甚至能向AI重新學習母語。

「就算只是把一顆微小的石頭丟進大海,我也要試著激起更大的浪花。」他說。只要有人願意在大海中持續激起浪花,美麗的台灣母語,就不會在AI時代的浪潮中失聲。

#商周2000期

15/03/2026

別再怪 Nano Banana 2 畫出來的圖很醜,是你根本不會用。

Google 官方終於親自下場教你怎麼用 Nano Banana 2。

如果你還在寫一串長得連 AI 也看不懂的提示,馬上停下來。

一起了解如何用 Nano Banana 生圖:

1. 用哪個模型好?

現在Nano Banana 有 3 個模型: ( 在 AI Studio )

- Nano banana 1
- Nano Banana 2
- Nano Banana Pro

如果 1 滿足到你,就繼續用 1 。 不需要轉,因為它仍然是最快最便宜的選擇。

不過,它沒有思考模型。 如果你的圖很單純地只是把文字變圖,可以繼續用。

但是,如果你需要更多細微差別、要更大幅度地讓 AI 遵循指,Nano Banana 2 絕對值得稍微增加的價格。( 生成infographic 、細節度高的圖片)

2. Nano Banana Pro:

很多人面臨的問題是: 2 還是 Pro 好?

在這裡,官方說:

「可以把 Nano Banana 2(Gemini-3.1-Flash)看作是以一小部分成本提供了 Pro 約 95% 的能力。對於幾乎所有新項目,Nano Banana 2 應該是你的首選默認選項。」

也就是說,如果你在生成某些圖片,發現 2 生成不了或效果不理想,就轉回用 Pro。

就像你發現Gemini 3.1 Flash 的回應很一般,就轉去用 Gemini 3.1 Pro 一樣。

3. 圖象定位 (Image Grounding)

「當你需要表現特定地點、紀念碑或高度特定的生物物種時,這個功能非常強大。」

當你要用Nano Banana 2 生成現實世界圖片時,這個功能很強大。 它會在互聯網中搜尋真實的圖片片作為參考。

當你要找地點或自然環境時,這個功能可以幫到你。

提示詞例子:( 官方用法 ,在圖片前加上: Specific Location Grounding )

Specific Location Grounding: "Generate a cinematic, golden-hour photograph of Southmead Hospital in Bristol, England. Ensure the architectural details, particularly the modern curved glass facade of the Brunel building, the main entrance plaza, and the surrounding environment, are accurate to reality."

4. 極端大小

Nano Banana 2 有 2 個新的比例: 1:8 和 1:4,有垂直和水平的格式。

例如,如果你想環生成 4 格漫畫,可以這樣:

Horizontal Comic Strip: "Create a 4-panel horizontal comic strip (aspect ratio 4:1). The story follows a mischievous cat trying to steal a fish from a kitchen counter that ends with a twist. Use a vibrant, Franco-Belgian comic book style. Keep the cat's design consistent across all panels."

你可以直接地根據你的需要,生成漫畫風格圖片。

5. 思考模式

Nano Banana 2 有了一個思考模式。

你可以選擇是否打開。 ( 在 AI Studio 中,打開後價格會高一點 )
你不一定要每次都打開。 對於一般圖片,關掉可以省錢省時間。

什麼時候要用到?

- 生成圖片時需要一些推理
- 你的資訊圖片很複雜
- 圖片有一些複雜的事情要達到

6. 提示詞例子

看到這裡,大家都可能會問一個問題:「 怎樣用 Nano Banana 2 才可以生成想要的圖片?」

在文章中,作者 Giom 分享了一些他喜愛的例子,雖然不是什麼具體教學。 但是,從中我們可以參考到他是怎樣寫提示詞的。
我這裡參考了他的提示,再用了我自己的圖片作為示範。( 我翻譯成繁體中文了 )

第一張: 生成卡通版的自己。

嚴格根據上傳的參考圖像,創建一個寫實場景,畫面中包含真實人物與其巨大 3D 動畫風格化版本並肩而立。兩者必須具備完全相同的面部構造、服裝與姿勢。真實人物自然微笑,並將手搭在 3D 角色的肩膀上。

3D 版本比例更大,解剖結構與真人一致但經過風格化處理,擁有生動的眼神和俏皮的微笑。背景為簡潔的灰藍色攝影棚,採用電影感燈光與清晰的紋理。(註:此提示詞需要搭配上傳圖片使用)。

Isaac 建議: 在使用此提示詞時,您可以根據想要的效果微調「3D 風格」的具體描述,例如:若想要更像皮克斯(Pixar)風格,可以加入:"Pixar-style 3D render"。

例子2 :地圖上的歷史

這個有趣,就是讓Nano Banana 2 生成歷史事件,讓你好像身處在其中。

為了幫助大家了解,我把原提示詞從英文翻譯成中文了。

「生成一張西元 800 年 12 月 25 日查理曼大帝加冕典禮的超寫實影像,完美模擬 Google 地圖街景(Street View)的拍攝畫面。

畫面呈現教宗利奧三世在舊聖伯多祿大殿內,將帝國皇冠戴在跪下的查理曼頭上。包含 123 度廣角桶形失真、半透明的 Google 地圖 UI 介面疊加(導航指北針、2D 地圖縮圖、懸浮在石地板上的白色導航 V 型箭頭),以及「© Google 800」浮水印。基於隱私保護,查理曼、教宗及周圍中世紀貴族的臉部需自動模糊。光源使用大殿內昏暗溫暖的火炬與燭光,帶有戲劇性的陰影,以及 360 度全景相機在低光源室內拍攝時常見的高 ISO 數位雜訊。」

在這裏,大家可以看到圖片就像是我們平時在Google Maps時看到的一些參考圖一樣。

例子 3 :

動畫變真實

上傳一張動畫的圖片,然後利用AI幫你變成一張真實的攝影圖片。( 你可以幻想就是把一些動畫真人化)

提示:

將這個上傳的動畫靜止畫面轉換為超現實、電影般的、完全逼真的場景。將動畫角色轉換為真實的人類,同時完美保留他們的原始身份、面部結構、服裝、表情和整體相似性。(注意:需要上傳圖像)。

7. 如何像 Google 工程師一樣寫提示詞?

參考了一堆提示詞後,這是我個人的想法:

7.1 物理規律與「技術參數」的精確控制

不要只說「高畫質」,給出具體的攝影參數來模擬特定的視覺質感。

例如:

鏡頭感與畸變:

在「地圖上的歷史」中,使用了 「123 度廣角桶形失真」(123-degree wide angle barrel distortion)。這不是隨機的詞,而是為了精準模擬 Google 街景那種特有的魚眼效果。

7.2 光學瑕疵:

為了真實,他們會主動要求「缺點」。

例如:「高 ISO 數字噪點」(high ISO digital noise) 模擬低光拍攝,或 「蠟質污跡」(waxy smudges) 模擬幼兒園作品。

7.3 強調一致性與邏輯關係

在處理「圖生圖」或「風格轉錄」時,專家會反覆強調身份的保留,以防止 AI 跑題。

他們會使用 「相同的面部結構」(same facial structure)、「解剖學上相同」(anatomically identical) 這樣的詞彙。

這是在告訴 AI:你可以改變皮膚質感,但骨骼不能動。

7.4 元元素 (Meta Elements)置入

高手會要求 AI 生成原本不屬於「現實世界」但屬於「畫面載體」的元素。

7.4.1 UI 覆蓋層:

在地圖示例中,要求加入 「導航指南針、2D 地圖縮略圖、白色方向箭頭」。這些元素讓圖像看起來不像是一張畫,而是一個「螢幕截圖」。

7.4.2 水印與版權:

加入「© Google 800」水印,這是一種極致的細節控,用來欺騙大腦的視覺慣性,增加沉浸感。

7.4.3 隱私邏輯:甚至考慮到 「自動模糊面孔以保護隱私」。

這讓生成的圖像具備了某種「功能性」偽裝。

下次當你想要寫一個提示詞時,可以嘗試這套 「三層構建法」:

底層: 它是什麼?(主體 + 動作)
中層: 它在哪裡看?(攝影參數 + 光線 + 環境)
頂層: 它有什麼特殊印記?(UI、水印、特定的藝術瑕疵)

基於這則教學,我建立了一個Gemini Gem,幫助大家快速生成Nano Banana 提示。

留言gem1,我立刻傳給你。

27/02/2026

知名遊戲引擎 Unity 將在 GDC 投下震撼彈!他們準備推出全新的 AI 創作工具測試版,號稱開發者完全不需要編寫任何程式碼,只要透過「自然語言」下指令,就能直接生成一款完整的電子遊戲。這項創舉預計將在 2026 年成為 Unity 的第二大發展重點,展現了其重塑遊戲開發流程的野心。

對於許多懷抱遊戲夢卻不懂程式語法的人來說,這無疑是個令人振奮的消息!這款 AI 工具將允許開發者使用自然語言下達指令,系統便能自動生成完整的休閒遊戲。更棒的是,它將原生適配 Unity 平台,讓從創意發想到原型製作的流程變得前所未有的簡單,不僅讓非專業人士也能參與創作,專業開發者也能大幅縮短前期開發時間。

這套強大的 AI 背後集結了各家大模型精華,整合了 OpenAI 的 GPT 系列、Meta 的 Llama 模型,以及 Scenario、Layer AI 等基於 Stable Diffusion、FLUX 等技術的合作夥伴,確保生成內容的品質。Unity 執行長強調,目標是消除創作障礙,預估未來將有數千萬名「新面孔」加入互動娛樂內容的創作行列。究竟這項技術能否如宣傳般順暢,3 月的 GDC 大會將揭曉答案!

https://www.techbang.com/posts/128003-unity-gdc-ai-game-gen-openai-meta

27/02/2026

Address

台北市北投區學園路1號
Taipei
112

Alerts

Be the first to know and let us send you an email when 藝教長工互動研究室 posts news and promotions. Your email address will not be used for any other purpose, and you can unsubscribe at any time.

Contact The University

Send a message to 藝教長工互動研究室:

Share