本发明提供一种语音拾取装置及多媒体设备。所述装置包括:用于采集图像的图像采集单元;与图像采集单元电性连接以对采集到的图像进行人脸识别的人脸识别单元;用于采集语音信号的语音采集单元;与语音采集单元连接以调整语音采集单元朝向的转向调整单元;与图像采集单元、人脸识别单元、语音采集单元、转向调整单元电性连接的处理控制单元。处理控制单元在人脸识别单元识别到采集的图像中存在人脸时,控制转向调整单元使语音采集单元对准所述人脸所在的方位,并控制语音采集单元对人脸所在方位的语音信号进行采集。所述装置能够根据用户的脸部位置自动转向地对用户发出的语音信号进行定向语音拾取,降低外界噪声干扰。