其他
Linus::我略微出手修改几行内核代码就提升了2.6%性能
OSCHINA
↑点击蓝字 关注我们
整体的代码改动如下(有请懂的大佬在评论区解读一波):“64 位 copy_from_user () 中的 barrier_nospec () 函数运行速度很慢。
如果地址无效,可以使用 pointer masking 来强制用户指针全为 1。”
@@ -38,6 +38,7 @@
#else
#define can_do_masked_user_access() 0
#define masked_user_access_begin(src) NULL
+ #define mask_user_address(src) (src)
#endif
/*
@@ -159,19 +160,27 @@ _inline_copy_from_user(void *to, const void __user *from, unsigned long n)
{
unsigned long res = n;
might_fault();
- if (!should_fail_usercopy() && likely(access_ok(from, n))) {
+ if (should_fail_usercopy())
+ goto fail;
+ if (can_do_masked_user_access())
+ from = mask_user_address(from);
+ else {
+ if (!access_ok(from, n))
+ goto fail;
/*
* Ensure that bad access_ok() speculation will not
* lead to nasty side effects *after* the copy is
* finished:
*/
barrier_nospec();
- instrument_copy_from_user_before(to, from, n);
- res = raw_copy_from_user(to, from, n);
- instrument_copy_from_user_after(to, from, n, res);
}
- if (unlikely(res))
- memset(to + (n - res), 0, res);
+ instrument_copy_from_user_before(to, from, n);
+ res = raw_copy_from_user(to, from, n);
+ instrument_copy_from_user_after(to, from, n, res);
+ if (likely(!res))
+ return 0;
+fail:
+ memset(to + (n - res), 0, res);
return res;
}
extern __must_check unsigned long
虽然不清楚这一微小的优化最终是否会对其他合成或实际工作负载产生影响,但无论如何,对内核的每一点优化终归是好事...... 尤其是当这种优化是避免 barrier_nospec 开销的结果。该补丁已合并到 Linux 内核的 Git 代码仓库中,并将成为 11 月下旬发布的 Linux 6.12 稳定版的一部分。
详情查看发布公告:
https://git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux.git/commit/?id=0fc810ae3ae110f9e2fcccce80fc8c8d62f97907
END
热门文章
影视飓风那个视频全网下架!还得看看开发者来讲讲视频平台整体技术神级开源“无头”组件库:已收获7万多star、在国外爆火,前端开发者一定要试试Electron与Tauri:你选择哪款跨平台框架?近2万star的开源实时系统监控工具btop:高颜值、支持Linux和Mac,用了就再也回不去了!微信工程师:原生鸿蒙是一套新的技术框架,编程语言是独特的ArkTS语言↓分享、在看与点赞~Orz