2012年至今瑞星一直在持续地研究,严谨地使用。不断尝试跨过机器学习在恶软检测领域应用的最大障碍:不可控的误报问题。2017年,我们推出了针对 Windows 可执行文件AI引擎,使用随机森林模型,训练于亿级样本,我们称之为RDM+引擎。随机森林通常仅对训练集合表现优异,在训练集足够大的情况下,这恰恰是优点。在生产环境中使用特征向量的哈希值来标注误报,在预测前返回正确结果,等待下次预测模型更新。在各阶段训练过程中,优选黑、增加白都可以使整个模型倾向于“非黑”的预测结果。结合其他各类遥感数据途径,以最快的速度发现潜在的误报,并进行遮蔽和训练集更新。