負責語音助手系統(tǒng)的高并發(fā)音視頻流處理模塊開發(fā),包括實時傳輸、編解碼、存儲與分發(fā)
設計分布式音視頻服務架構,優(yōu)化端到端時延與系統(tǒng)穩(wěn)定性(如低延遲語音交互、視頻流處理)
實現(xiàn)音視頻協(xié)議適配(如WebRTC、RTMP、SIP)及媒體格式轉換(AAC/Opus等)
算法模塊集成與部署
將ASR(自動語音識別)、TTS(文本轉語音)、聲紋識別等算法模塊部署到Go后端,實現(xiàn)端到端流程整合
負責模型輕量化、ONNX轉換、TensorRT加速等部署優(yōu)化工作(需熟悉模型壓縮與推理引擎)
設計算法服務接口,實現(xiàn)與前端語音交互框架的高效對接
系統(tǒng)性能與穩(wěn)定性保障
優(yōu)化Go服務的高并發(fā)處理能力(如goroutine管理、內(nèi)存池技術)
構建自動化監(jiān)控體系,確保音視頻服務與算法模塊的實時性、可用性
任職要求
核心技能:
Go語言深度掌握:3年以上Go開發(fā)經(jīng)驗,熟練使用Gin、Echo等Web框架,精通goroutine、channel、內(nèi)存管理等并發(fā)特性
音視頻技術棧:
熟悉FFmpeg、GStreamer等工具的Go交互開發(fā)
熟悉AAC、Opus等音頻編碼及RTP/RTCP協(xié)議實現(xiàn)
算法部署實戰(zhàn)經(jīng)驗:
有ASR/TTS算法部署落地經(jīng)驗(如集成DeepSpeech、OpenVINO、PaddlePaddle等框架)
熟悉模型轉換工具(如ONNX Runtime)、推理引擎優(yōu)化技術
熟練使用Python/C++對算法模塊進行封裝與調(diào)用
加分項:
具備語音信號處理(VAD、降噪、聲學前端處理)相關開發(fā)經(jīng)驗
熟悉Kubernetes/Docker等容器化部署及微服務架構
參與過實時性要求高的系統(tǒng)設計(如在線會議、直播平臺)