Adobe开源了一款工具 Stringlifier,检测以明文形式随机生成的字符串。该工具由 Python 语言编写,利用机器学习区分随机字符序列和正常的文本序列。
该开源项目有助于分析安全日志和应用日志,或者发现不慎遭泄露的凭据。不管是哈希、API 密钥、随机生成的密码或源代码、日志或配置文件中的其它随机字符串类型,都可以通过 Stringlifier 识别。Stringlifier 的源代码已发布在 Adobe 的GitHub 公开库中,不过 Adobe 还发布了包含预先训练模型的“pip”安装包。Adobe 表示除了使用 Tripod 外,该公司已经在查找数据集异常过程中使用 Stringlifier 来识别随机字符串。该公司虽然使用多种预进程方式并将长字符串转换为数字形式,但这些方法在遇到随机字符串时无法运转,从而破坏集群算法。通过<RANDOM_STRING> 替代所有的随机字符序列,Adobe 能够轻易地将类似的命令行分组,即使参数中使用了随机哈希也不例外。Adobe 公司表示,“我们希望你能用到 Stringlifier。全部源代码已发布在 Adobe 的 GitHub 仓库中。你还可以从该仓库中找到我们的其它开源项目。期待收到你的反馈并欢迎你成为其中的一份子。”Adobe 公司还发布了Stringlifier 的使用指南以及用户在查找不同字符串类型时如何训练模型。GitHub地址:https://github.com/adobe/stringlifier。
https://www.securityweek.com/adobe-open-sources-tool-sanitizing-logs-detecting-exposed-credentials
题图:Pixabay License
本文由奇安信代码卫士编译,不代表奇安信观点。转载请注明“转自奇安信代码卫士 www.codesafe.cn”。
奇安信代码卫士 (codesafe)
国内首个专注于软件开发安全的
产品线。
觉得不错,就点个 “在看” 吧~