最新国产在线不卡AV,国产又爽又黄的视频免费看,精品综合久久久久久97,日韩欧美高清中文字幕免费一区二区

科普

兒童畫|簡(jiǎn)筆畫|手抄報(bào)|黑板報(bào)|我要投稿|加入收藏

9252兒童網(wǎng) > 科普 > 科技知識(shí) >

如何從一名軟件工程師轉(zhuǎn)行做人工智能科技知識(shí)

科技知識(shí) 由小雪供稿 2022-11-15 08:04:59

　　人工智能是一個(gè)令人興奮、不斷變化的領(lǐng)域，一名軟件工程師如果打算轉(zhuǎn)行做人工智能，需要掌握哪些技能呢?以下是9252兒童網(wǎng)小編為你整理的轉(zhuǎn)行做人工智能所需技能，希望能幫到你。

　　將機(jī)器學(xué)習(xí)作為一項(xiàng)技能

　　作為軟件工程師關(guān)鍵在于要緊跟框架、標(biāo)準(zhǔn)以及范式的最新狀態(tài)。軟件工程師不停地努力學(xué)習(xí)，希望把最好的工具運(yùn)用到工作中。機(jī)器學(xué)習(xí)在當(dāng)今諸多的應(yīng)用程序中找到了立足點(diǎn)，很自然地它就變成了許多工程師想要掌握的一項(xiàng)技能。

　　但是，相比于新框架機(jī)器學(xué)習(xí)更難掌握。作為一個(gè)高效的實(shí)踐者，你需要充分理解該領(lǐng)域的理論、廣泛掌握當(dāng)前最尖端的知識(shí)，并且有能力以不確定的方式塑造問題。

　　網(wǎng)上很多的指南只會(huì)簡(jiǎn)單地教你如何在一個(gè)策劃好的數(shù)據(jù)集上訓(xùn)練可以立即使用的模型，并達(dá)到一個(gè)不錯(cuò)的準(zhǔn)確度，然后就結(jié)束了。事實(shí)上，要成為一個(gè)優(yōu)秀的機(jī)器學(xué)習(xí)工程師必須掌握更加廣泛的技能。

　　轉(zhuǎn)行人工智能需掌握的技能

　　1.統(tǒng)計(jì)學(xué)

　　為了理解機(jī)器學(xué)習(xí)，堅(jiān)實(shí)的統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)是必須的。這包括：

　　評(píng)估模型成功的不同方法(精確度、召回率(recall)、特征曲線下的面積等)。你選擇的損失函數(shù)和評(píng)估指標(biāo)如何測(cè)量你的模型輸出的偏差。

　　如何理解過擬合(overfitting)和欠擬合(underfitting)，以及偏差/變量權(quán)衡。

　　模型的結(jié)果與置信度之間有什么聯(lián)系。

　　2.機(jī)器學(xué)習(xí)理論

　　當(dāng)你在訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí)，實(shí)際上發(fā)生了什么?是什么使這些任務(wù)可行而其它的不行呢?對(duì)待該問題的好方法是，在深入理解理論之前，首先通過圖和實(shí)例理解機(jī)器學(xué)習(xí)。

　　需要理解的概念有不同的損失函數(shù)工作的方法，反向傳播有用的原因，以及計(jì)算圖究竟是什么。深入理解構(gòu)建函數(shù)模型并且與團(tuán)隊(duì)其他成員有效地對(duì)其進(jìn)行溝通非常關(guān)鍵。

　　另一個(gè)基礎(chǔ)技能是有能力閱讀、理解和實(shí)驗(yàn)研究論文。起初看上去這似乎是一個(gè)艱巨的任務(wù)，所以一個(gè)不錯(cuò)的方法是從一篇后面附有代碼的論文開始，并深入理解其實(shí)現(xiàn)。

　　3.數(shù)據(jù)整理(Data Wrangling)

　　問任何一個(gè)數(shù)據(jù)科學(xué)家，他們會(huì)告訴你其 90% 的工作是數(shù)據(jù)再加工(data munging)。它對(duì)于應(yīng)用人工智能的重要性就如同你的模型的成功與你的數(shù)據(jù)的質(zhì)量(和數(shù)量)高度相關(guān)一般。數(shù)據(jù)在許多方面起作用，可分為以下幾個(gè)類別：

　　(1)數(shù)據(jù)獲取(找到好的數(shù)據(jù)源，精確測(cè)定數(shù)據(jù)的質(zhì)量和分類，獲取并推理標(biāo)簽)。

　　(2)數(shù)據(jù)預(yù)處理(補(bǔ)全缺失值(missing data)、特征工程、數(shù)據(jù)增強(qiáng)、數(shù)據(jù)歸一化、交叉檢驗(yàn)拆分)。

　　(3)數(shù)據(jù)后處理(使模型的輸出有用，去除人為數(shù)據(jù)，處理特殊情況和異常值)。

　　熟悉數(shù)據(jù)整理的最好方法是掌握原始的數(shù)據(jù)集，并嘗試使用它。網(wǎng)上有很多的數(shù)據(jù)集并且許多社交媒體和新聞媒體網(wǎng)站都有著很好的應(yīng)用程序接口。

　　4.調(diào)試/調(diào)節(jié)模型

　　對(duì)一些不收斂或者包含與調(diào)試代碼非常不同的過程但是給出合理結(jié)果的機(jī)器學(xué)習(xí)算法進(jìn)行調(diào)試。同樣地，找到正確的架構(gòu)和超參數(shù)需要堅(jiān)實(shí)的理論基礎(chǔ)，良好的基礎(chǔ)建設(shè)工作可以測(cè)試不同的配置。

　　由于該領(lǐng)域在向前發(fā)展，調(diào)試模型的方法也在不斷進(jìn)化。以下是從我們的討論和部署反映了 KISS 理論和軟件工程師之間的熟悉度的模型的經(jīng)驗(yàn)中得來的「合理性檢查(sanity checks)」。

　　盡快從已被證明可以在類似數(shù)據(jù)集上工作的簡(jiǎn)單模型入手，掌握基線。古典統(tǒng)計(jì)學(xué)習(xí)模型(線性回歸、最近鄰等)或者簡(jiǎn)單的啟發(fā)式方法或規(guī)則會(huì)讓你明白 80% 的方法并且更快地進(jìn)行實(shí)現(xiàn)。入門的時(shí)候，以最簡(jiǎn)單的方法去解決問題(查看谷歌機(jī)器學(xué)習(xí)規(guī)則的第一點(diǎn))。

　　如果你決定訓(xùn)練一個(gè)更加復(fù)雜的模型以在基線上有所提升，不妨從數(shù)據(jù)集的一小部分入手，在分?jǐn)?shù)據(jù)集上訓(xùn)練模型使其過擬合。這保證了你的模型最起碼的學(xué)習(xí)能力。不斷地在模型上迭代直到你可以過擬合 5% 的數(shù)據(jù)。

　　一旦你開始在更多的數(shù)據(jù)上訓(xùn)練，超參數(shù)就開始變得更重要了。理解這些參數(shù)背后的理論從而理解什么是要探索的合理值。

　　使用理論方法調(diào)節(jié)你的模型。寫下你使用的最低限度的配置并總結(jié)其結(jié)果。理想情況下，使用自動(dòng)超參數(shù)搜索策略。在最開始，隨機(jī)搜尋可能就足夠了。盡可能地去探索更多理論方法吧。

　　許多步驟都能被你的開發(fā)技能加速，這引出了最后一個(gè)技能。

　　5.軟件工程

　　許多應(yīng)用型機(jī)器學(xué)習(xí)允許你充分利用軟件工程技巧，有時(shí)需要做些變換。這些技巧包括：

　　測(cè)試轉(zhuǎn)換線路的不同方面(數(shù)據(jù)預(yù)處理和增強(qiáng)、輸入和輸出清除、模型推理時(shí)間)。

　　構(gòu)建模塊化的代碼和可重復(fù)的實(shí)驗(yàn)加速方法。

　　在訓(xùn)練的不同階段備份模型(檢查點(diǎn))。

　　建立一個(gè)分布式基礎(chǔ)架構(gòu)來運(yùn)行訓(xùn)練、超參數(shù)搜索或者更有效地推理。

上一篇：就寢時(shí)間拖延癥的原因下一篇：返回列表

相關(guān)文章

為你推薦

155

科技知識(shí)欄目推薦

1
牛奶什么時(shí)間喝最好
閱讀:10