蘋果的新機器學習研究將有助於蘋果情報變得更聰明

蘋果的機器學習研究人員已經致力於改進的眾多方法正如一次大型AI會議所接受的研究論文所表明的那樣,其他生成的AI系統。

Apple的Apple Intelligence和其他機器學習工具的創建需要大量研究。這既是為了改善現有產品,也是為了為蘋果公司尚未為用戶提供用戶的未來服務。

蘋果在這項工作中瞥見了這項工作,選擇論文第十三國際學習表現會議的接受,可以更多地了解這項工作。

增強計算機視覺和計算機視覺

機器學習研究的關鍵領域之一是計算機視覺。從圖像中汲取信息的能力可以為系統提供可觀的優勢。

在介紹“ Depth Pro:不到一秒鐘的尖銳單眼深度”時,Apple解釋瞭如何確定單個圖像的深度信息。這包括創建高分辨率深度圖,並考慮到諸如頭髮或絨毛之類的細節。

該系統還設法無需元數據,例如使用了哪種相機。

深度專業深度圖示例 - 圖片來源:蘋果

雖然計算機視覺是一個重要領域,但另一個方向是產生圖像的另一個方向。在兩篇用於文本到圖像生成和控制的論文中,Apple提供了一種控制輸出的技術,而另一個則為基於擴散的基於基於擴散的文本到圖像的新技術處理了新技術。

對於前者,蘋果將其描述為使用激活傳輸,這是使用最佳傳輸理論轉向激活的代際框架。這使用了以前的激活驅動作品的概括。

DART(用於可擴展的文本到圖像生成的自動回歸變壓器)是一個論點,即馬爾可夫流程的當前降級以添加噪聲到一個過程的訓練效率低下。取而代之的是,蘋果提供了基於變壓器的模型,以在非馬克維亞框架內統一自動回歸和擴散。

結果是一個更有效的系統,同時仍然靈活,並且能夠在統一模型中訓練文本和圖像數據。

決策和推理

由於Apple Intelligence有可能代表用戶激活應用程序並執行任務的潛力,研究人員必須研究系統以確定的水平執行此類任務。

Apple研究人員將建議使用LLM的一般知識來用於加強代理商的政策學習,“用於順序決策的大語言模型的建模功能”的演示文稿。

結果表明,使用通才基礎模型和自動註釋而不是“昂貴的人為設計的獎勵功能”,它可能可行。這可能意味著可以將更有效的培訓系統用於創建模型。

當涉及一項複雜的任務時,模型必須通過推理步驟進行工作,但是每個模型都可能是錯誤陷入問題並引起問題的機會。儘管當前的研究使用了加權多個解決方案的外部驗證者,但它也受到抽樣效率低下的影響,需要大量的監督。

飛鏢圖像生成的示例 - 圖片來源:蘋果

“通過扭曲的順序蒙特卡洛(Monte Carlo)逐步推理數學問題”提供了一種完善抽樣工作的方式,以便更多地關注有希望的解決方案。通過估計部分解決方案的預期未來獎勵,可以通過依賴人類干擾的方式對模型進行培訓。

為了使用LLMS創建安全的AI代理,需要模型遵循用戶提供的約束和準則。但是,LLM通常也無法遵循基本命令。

介紹“ llms在內部是否知道何時遵循說明?”將探討LLM是否在其表示中編碼信息是否與成功的遵循指示相關。這包括對響應是否符合指令的預測進行預測,並將其有效性概括為潛在的類似任務。

具有LLM的明顯可能性,指的是不正確的結果,但作為事實交付,也需要LLMS估算其自身的確定性。 “ LLMS估計不確定性的不確定性在下面的教學中是否很好?”的另一個演講?將評估LLM的能力,以確定它們能夠估計其不確定性的能力。

蘋果認為當前的估計方法運行較差,因此需要更改。

蘋果在會議上

蘋果研究人員將在4月24日至4月28日在新加坡舉行的各種主題的ICLR提交研究。蘋果還在C03位置主持一個展位,並在會議期間贊助了Affinity集團主持的活動。

在其展位上,與會者可以嘗試零深度估計系統。他們還可以查看FastVLM,這是一個由移動友好的視覺語言模型的家庭。