1、基于業(yè)務(wù)場(chǎng)景(如計(jì)算機(jī)視覺、自然語言處理、推薦系統(tǒng)等)設(shè)計(jì)或改進(jìn)算法模型,例如:計(jì)算機(jī)視覺:目標(biāo)檢測(cè)(YOLO、Faster R-CNN)、圖像分割(Mask R-CNN)、OCR識(shí)別;自然語言處理:文本分類、命名實(shí)體識(shí)別(NER)、機(jī)器翻譯、大模型微調(diào)(LoRA、SFT);機(jī)器學(xué)習(xí):特征工程、分類/回歸模型(XGBoost、LightGBM)、強(qiáng)化學(xué)習(xí)策略設(shè)計(jì)。
2、參與算法選型與評(píng)估,對(duì)比不同模型的精度、效率及可解釋性(如A/B測(cè)試驗(yàn)證算法效果);
3、主導(dǎo)數(shù)據(jù)采集、清洗、標(biāo)注與增強(qiáng)(如圖像裁剪、文本脫敏、數(shù)據(jù)均衡處理),確保數(shù)據(jù)質(zhì)量滿足模型訓(xùn)練需求;
4、設(shè)計(jì)高效特征提取方案,結(jié)合領(lǐng)域知識(shí)構(gòu)建特征工程(如時(shí)間序列特征、用戶行為特征);
5、基于PyTorch、TensorFlow等框架搭建訓(xùn)練流程,配置超參數(shù)(學(xué)習(xí)率、 batch size、迭代次數(shù))并優(yōu)化收斂效果;
6、對(duì)模型進(jìn)行量化、剪枝、知識(shí)蒸餾,適配邊緣設(shè)備(如手機(jī)、嵌入式設(shè)備)或低延遲場(chǎng)景,降低部署成本;
7、優(yōu)化推理速度(如TensorRT加速、ONNX格式轉(zhuǎn)換),滿足生產(chǎn)環(huán)境的實(shí)時(shí)性要求(如毫秒級(jí)響應(yīng));
8、持續(xù)跟蹤模型線上性能(如精度衰減、數(shù)據(jù)漂移),通過增量訓(xùn)練或算法迭代優(yōu)化效果。
任職要求:
1、具備核心數(shù)學(xué)知識(shí),例如:線性代數(shù):矩陣運(yùn)算、特征值分解、PCA降維(模型特征提取基礎(chǔ));概率統(tǒng)計(jì):貝葉斯理論、概率分布(如高斯分布)、假設(shè)檢驗(yàn)(A/B測(cè)試依據(jù));最優(yōu)化理論:梯度下降、隨機(jī)梯度下降(SGD)、Adam等優(yōu)化器原理(模型訓(xùn)練核心);微積分:偏導(dǎo)數(shù)、鏈?zhǔn)椒▌t(反向傳播算法基礎(chǔ));
2、具備機(jī)器學(xué)習(xí)/深度學(xué)習(xí)理論掌握經(jīng)典模型原理:決策樹、SVM、邏輯回歸、神經(jīng)網(wǎng)絡(luò)(CNN/RNN/Transformer架構(gòu));理解模型評(píng)估指標(biāo):準(zhǔn)確率(Accuracy)、精確率(Precision)、召回率(Recall)、F1值、ROC/AUC(模型效果量化);
3、精通Python(主流開發(fā)語言,熟練使用NumPy、Pandas、Scikit-learn);
4、熟悉C/C++(高性能計(jì)算場(chǎng)景,如模型推理加速)、CUDA(GPU并行編程);
5、精通至少一種主流框架(PyTorch/TensorFlow/Keras),熟悉模型構(gòu)建、訓(xùn)練、部署全流程;
6、自然語言處理(NLP):文本分類、命名實(shí)體識(shí)別(NER)、大模型微調(diào)(LoRA、SFT)、RAG(檢索增強(qiáng)生成);
7、機(jī)器學(xué)習(xí):特征工程、集成學(xué)習(xí)(XGBoost、LightGBM)、強(qiáng)化學(xué)習(xí)(策略梯度、Q-learning);
8、具備模型優(yōu)化能力,具備3年以上算法開發(fā)優(yōu)化經(jīng)驗(yàn)。