你可以信任由编译器优化的代码吗？( 三 ) _代码

// 450 millisecondsfn common_prefix(xs: &[u8], ys: &[u8]) -> usize {let chunk_size = 16;let mut result = 0;'outer: for (xs_chunk, ys_chunk) inzip(xs.chunks_exact(chunk_size), ys.chunks_exact(chunk_size)){for (x, y) in zip(xs_chunk, ys_chunk) {if x != y { break 'outer; }result += 1}}for (x, y) in zip(&xs[result..], &ys[result..]) {if x != y { break; }result += 1}result}【你可以信任由编译器优化的代码吗？】其实，上述代码在速度上的提升是远远不够的。具体来说，SIMD需要以相同的方式，并行处理块中的所有值。在上述代码中，我们用到了一个break 。这意味着第n对字节的处理，取决于第n-1对。我们可以通过禁用短路（short-circuiting），来检查整个字节块是否匹配。当然，我们并不关心具体哪个特定字节出现了不匹配：
// 80 millisecondsfn common_prefix3(xs: &[u8], ys: &[u8]) -> usize {let chunk_size = 16;let mut result = 0;for (xs_chunk, ys_chunk) inzip(xs.chunks_exact(chunk_size), ys.chunks_exact(chunk_size)){let mut chunk_equal: bool = true;for (x, y) in zip(xs_chunk, ys_chunk) {// NB: &, unlike &&, doesn't short-circuit.chunk_equal = chunk_equal & (x == y);}if !chunk_equal { break; }result += chunk_size;}for (x, y) in zip(&xs[result..], &ys[result..]) {if x != y { break; }result += 1}result}至此，矢量化已成功开始，而且几乎减少了一个数量级的运行时间。我们现在可以使用迭代器来进行压缩了。
// 80 millisecondsfn common_prefix5(xs: &[u8], ys: &[u8]) -> usize {let chunk_size = 16;let off =zip(xs.chunks_exact(chunk_size), ys.chunks_exact(chunk_size)).take_while(|(xs_chunk, ys_chunk)| xs_chunk == ys_chunk).count() * chunk_size;off + zip(&xs[off..], &ys[off..]).take_while(|(x, y)| x == y).count()}显然，此时的代码已与我们开始时有了显著不同。可见，我们不应盲目依赖编译器的优化，而需要知道在何种情况下进行特定优化，以触发它们编写代码的方式。例如，对于SIMD而言，我们需要根据处理元素块来表达算法。而且在每个块中，我们应确保没有分支，让所有元素都能以相同的方式处理。
原文链接：https://matklad.github.io/2023/04/09/can-you-trust-a-compiler-to-optimize-your-code.html
译者介绍陈峻（Julian Chen），51CTO社区编辑，具有十多年的IT项目实施经验，善于对内外部资源与风险实施管控，专注传播网络与信息安全知识与经验。

你可以信任由编译器优化的代码吗？( 三 )

推荐阅读

「河青新闻网廊坊新闻」爱心点亮生命——廊坊市红十字会团体会员单位济民口腔医院组织造血干细胞知识宣讲活动

每日经济新闻|美国银行Q2营收225亿美元超预期、净利润同比下滑超50%至32.8亿美元

血清钙增高

快讯神记|热巴受邀央视采访，无美颜生图传开后，这“建模脸”也是没谁了

央视网|江苏省公安厅刑警总队原总队长、刑侦局原局长罗文进被查

浙江省|2020年最惨高考状元，总分第一却无缘清华北大，本人亲自回应

肚子怎样才能瘦

阿虎汽车|全新MPV大众威然上市，4款车型可选，28.68万起售，埃尔法级享受

如何辨别环保家具的特点

什么是AUX接口 aux接口是什么？

#牛市#A股到底是牛市还是“牛屎”

鑫沐二哈经典语录

【淘宝】围观！华为正计划推出豪华智能手表来对抗Apple Watch，喜欢吗？

军训不晒黑的小妙招军训防晒霜排行榜

针织衫|入秋后，短裙收起来吧！看三木这样穿，时髦耐看又大方

巧克力牌子一个d，巧克力什么牌子的好吃，全球最好吃的十大巧克力？

处于这样尴尬的年龄我该咋办

推窗见月|特朗普在2020年美国国庆致敬仪式上的讲话

索尼|60Hz屏手机卖3500元索尼Xperia 10 IV上市：没有充电器

IE浏览器|韩国工程师给IE浏览器立碑图片疯传：墓碑逗笑全球网友作者回应