
[Tech Talk] — Open-Source Gemma 語言模型
在 Feb. 21, 2024,Google 正式推出 Gemini 系列的旁支開源模型 -- Gemma 語言模型。那麼究竟其效果如何呢?是否適合作為免費的 LLM 結合自己的程式呢?
在 Feb. 21, 2024,Google 正式推出 Gemini 系列的旁支開源模型 -- Gemma 語言模型。那麼究竟其效果如何呢?是否適合作為免費的 LLM 結合自己的程式呢?
在聆聽過程中,我們透過音色辨別出了樂器,透過音量與音高判斷出樂曲情境。生活中非常基本的常態,卻有著複雜的表現方式。那在程式中,我們又如何將其視覺化或修改呢?不外乎都要透過聲音特徵,為此讓我們先複習下基礎吧。
在我自製「畫家小工具」該過程中,圖片轉線稿是最重要的功能,而生活中在圖像編輯時,人們也常常拓寬邊線形成如貼紙的效果。除上述以外,邊線也是種方便我們尋找物體與看出圖片架構的方式。那我們能透過那些方法找到邊線並加以利用呢?
上回我們說到深度圖的主要用途,那接著就讓我們搭配 open3D 該 Library 將深度圖轉為 Point Cloud 的 3D 圖吧。
對於人眼說明立體感是非常簡單的,但我們如何讓電腦處理相同的情境呢?就要依靠深度圖標註亮(前景)與暗點(背景),提示其空間感。接著我們將簡單介紹深度圖與用 Python 的製作方式拉~
顏色是我們認識世界的主要管道,那麼在圖像辨識中,電腦又如何分辨這個差異呢?我們在學習過程中,又需要先理解那些色彩概念呢?