本发明公开了一种银行票据全自动化特征工程方法及装置,该方法包括:自动化票据识别;自动化数据清洗,形成基础数据集;自动化特征生成,根据当前票据的身份数据和下游机器学习分类任务类型,从数据库中读取历史票据数据加入基础数据集,通过构建特征生成树生成新的票据特征;自动化特征选择,通过将特征选择视为二元优化问题,分为靠近目标值和确定目标值两个阶段进行特征选择。本发明只需要在初始时设置可调节参数,后续流程皆可自动完成。本发明使用自动化特征工程能够节省人力、提高效率,有效为后续的银行票据机器学习分类任务提供优质特征。