字符串离奇消失之谜
The following article is from 未闻Code Author kingname
来源丨经授权转自公众号 未闻Code(ID:itskingname)
今天在交流群里,有人问了这样一个问题:
截图中涉及到的图片为:
一开始,我以为这是一个简单的问题,但后来发现事情并没有这么简单。
我要来了这个同学的代码,并在 PyCharm 里面使用调试模式运行,效果如下图所示:
截至到倒数第二行,con 字符串里面的数据还是正常的。但是一旦使用 print
函数打印出来,数据又不对了。
为了说明这个问题,我写一段代码简单复现一下这个问题。
从截图中可以看到,a
就是一个普通的列表,它并不是什么生成器。当我们直接 for 循环展开 a 列表,然后打印里面的数据的时候,都可以正常显示。但是当我提前使用''.join(a)
想把 a 列表里面的字符串拼接成一个字符串的时候,却发现只能显示 a 列表里面最后一个字符串。前两个字符串离奇消失了。
为了解释这个问题为什么会发生,我们来看看a
列表长什么样:
可以看到,a
列表里面,前两个元素的末尾都有一个\r
。我们再来看看使用''.join(a)
生成的 b 字符串长什么样:
注意,这里需要直接输入字符串的名字来显示它真实的样子,不能使用 print
函数打印。这两者的区别,大家可以看我的这篇文章:【一日一技】揭秘字符串的两副“面孔”。
大家看出来了吗?实际上,当我们执行''.join(a)
的时候,它是正确拼接了 a 列表里面的三个字符串的,得到的结果就是abc\rdef\rxyz\r
。但坏就坏在这里出现了\r
。这个符号在这里不是制表符,而是告诉输出的游标,现在移动到行首。
怎么理解这个现象呢,我们假设现在有编号为1-9的9个桶和编号为1-9的9个小球。正常情况下,把1号球放进1号桶,2号球放进2号桶,3号球放进3号桶……9号球放进9号桶。这是我们正常打印的流程。
但现在,我们在3-4号球之间加入一个特殊球,上面写着\r
。在6-7号之间也加入一个\r
球。首先把1号球放进1号桶,2号球放进2号桶,3号球放进3号。然后,你看到了\r
球,这个球不放进桶里面,但是需要你回到了1号桶,把4号球放进1号桶,5号球放进2号桶,6号球放进3号。接下来,你又遇到了\r
球,你又回到了1号桶旁边,把7号球放进1号桶,8号球放进2号桶,9号球放进3号。一番操作下来,所有桶里面,最上面的球只有7,8,9号。其他的1-6号球都被覆盖了。
注意,这里我用桶里面放球来举例,而不用 Word 打字来举例,是因为当我们使用 Word 的时候,如果你把光标重新移动到行首输入新的字符,已有的字符会按顺序往后退。但今天我们遇到的情况,是按顺序覆盖。所以不要搞混这两种情况。
为了证明这个按顺序覆盖
,我们来看下面这个例子:
请大家记住上面桶里面放球的例子,\r
球是不放进桶里面的,它是告诉你要回到行首。所以,我们的第一个字符串是11111111111
,由于它后面有一个\r
,所以现在重新回到行首,继续输出22222
。这里有5个2,所以此时字符串变成了22222111111
。这时又遇到了一个\r
,所以又回到了行首,输出333
。所以最终的结果是33322111111
。
这个问题的关键就是\r
,而不是''.join()
有什么问题,你甚至可以直接手动输入带有\r
的字符串,效果是一样的:
另外还需要注意的是,这个\r
只会影响print
函数的打印输出。但这个字符串本身不会出现\r
后面的字符覆盖前面的字符。所以,对于一个字符串aaaaa\rbb
,我们可以看到虽然 print
打印出来只有bbaaa
5个字符,但是它实际上有8个字符:
3、写了四十篇办公自动化文章后,我整理了这十个常用操作,代码拿走就用!
识别关注我们
了解更多精彩内容
点分享
点点赞
点在看