摘要
本文研究了基于机器学习方法的计算机攻击检测模型的构建与实际应用。在现有的公开数据集中,选取了最具相关性的CICIDS2017数据集作为研究基础。针对该数据集,详细设计并实现了数据预处理与采样流程。为降低计算时间开销,训练集中仅保留了单一类别的计算机攻击(暴力破解、跨站脚本攻击XSS、SQL注入)。文中系统描述了特征空间构建的全过程,成功将原始特征维度从85维显著缩减至10个最具代表性的关键特征。在预处理后的数据集上,对十种主流机器学习模型的性能进行了全面评估。在表现优异的模型(包括K近邻、决策树、随机森林、AdaBoost、逻辑回归等)中,综合考虑模型执行时间最短这一因素,最终确定选择随机森林模型。通过准最优的超参数调优,模型性能相较于先前已发表的研究成果得到了进一步提升。所构建的攻击检测模型在真实网络流量数据上进行了测试。实验结果表明,该模型的有效性仅在使用特定网络环境中采集的数据进行训练时成立,原因在于关键特征高度依赖于网络的物理拓扑结构及所用设备的具体配置参数。因此,研究结论指出:尽管机器学习方法在计算机攻击检测中具有可行性,但其应用需充分考虑上述实际限制条件。