訓練與知識庫建立的難度

訓練與知識庫建立的難度

4 11 月, 2024

今天發現員工訓練透過AI相對的進度一天是之前對別的工程師訓練5~10天的速度,如果設備及工具軟體全部買足(其實買足真的花了不少錢)。

這個實驗結果其實讓我發現導入AI到企業究竟有多重要,但現在面臨了一個問題是,基本上所有的理論除了我的七層式的理論以外,都是口述。

在口述的狀態下,要怎樣建立成知識庫,其實相當有挑戰,也就是不可能要工程師把我口述的整理後打下來,這樣訓練的速度會因為整理的速度變慢,再來是工程師通常較為不擅長文字。

那在這個狀態下,AI轉逐字稿怎樣?這是一個很合理的發想,但仔細思考一下就覺得爛到炸掉,因為在教學當中,比開會的一些語助詞或是贅字,或者思考的時候的聲音(會被AI認為是文字的),多個十倍以上。

會議逐字稿,可能稍微有意義,但教學逐字稿,我認為就算是轉文字後透過現在的大語言模型都沒辦法整理出要領。

而且口述的過程中不會有大綱,也就是不會有第一標題、第二標題,還有裡面粗體或底線,整體上來說當成文件一點用都沒有,這甚至還沒考慮到口述會有時候直接指著螢幕,或者接管對方滑鼠操作給對方看,根本不可能轉成文字。

也就是我可能得在未來人員增加的時候有一個職缺是「教育訓練資料整理人員」。當初考量的最佳化陣容,可能會需要多一個人,且這個人可能得在前期就補進來,不然中後期的戰力加上替補的戰力都會一個一個需要我親自訓練。

我好期待下週一引進Perplexity AI做內部資料搜尋,不過也要有內部資料讓AI搜尋就是了。

今天引進Replit做後端的雲端運算架設跟AI(這個可以省掉機器昂貴的CPU費用),還有Stackblitz(這個可以省掉機器編譯Angular的CPU耗損),前後端都有Cursor AI,然後都配有ChatGPT,因為現在規模還不足以買Team版(會多一個License浪費掉),現在都只買個體的付費版。

也是考慮到現在的資料即使被AI拿去訓練也無所謂,有機密程式碼的機器只有我家裡的那兩台有而已,包含完美解決瀏覽器路徑轉跳(上一頁、下一頁),以及前端框架JavaScript在重新整理變數會回到預設值或者空白,這個Angular的程式碼其實應該是最值錢的。

有一個企業機密我打算明天開始直接拿來當教學材料,那個是我打算取名字叫SecJWT的,要應用在我們公司自己的SSO上。有時想想,其實就算我Open Source台灣的競爭對手在幾年後照樣打不贏我們,所以就算外流也無所謂。

 

Leave A Comment