1. **创建与基本操作**
在 Python 中,通过单引号 `'` 或双引号 `"` 创建一个字符串,并支持多行字符串(用三个单引号或三重双引号括起)。例如:
python
s = "Hello, World!"
m = '''这是一个
多行字符串示例'''
- 索引与切片:同其他序列类型一样,可以通过索引来访问字符串中的某个字符,也能利用切片获取子串。
python
s[0] # 输出 'H'
m[3:] # 输出 '是一个\n多行字符串示例'
2. **格式化输出**
- 格式化字符串可以用 `%` 操作符实现简单替换:
python
name = "Alice"
print("你好,%s!" % (name))
而从 Python 3.6 开始引入了全新的 f-string (`f''`) 方式进行更为直观便捷地插入变量值:
python
age = 25
message = f"我的名字叫 {name},今年{age}岁。"
- `.format()` 方法提供了更复杂的格式设置能力,可以控制数字的小数点后位数以及填充宽度等特性:
python
pi_value = 3.1415926
formatted_pi = "{:.2f}".format(pi_value) # 结果为'3.14'
aligned_name = '{:<20}'.format(name) # 左对齐并固定长度至20个字符
3. **常用内建函数**
- len() 返回字符串长度;lower(), upper(), capitalize() 和 title() 可以转换大小写;
- replace(old, new[, max]) 替换旧字符串片段为新内容;
- split(sep=None) 将字符串分割成多个部分,默认按空格分隔返回列表;
- join(iterable) 把可迭代对象的所有元素连接到一起组成一个新的字符串;
- strip([chars]) 移除两端指定字符,默认移除非打印字符;
- startswith(prefix), endswith(suffix) 判断是否以特定前缀/后缀结尾开始;
- find(sub [,start [,end]]) 查找子串首次出现的位置,若未找到则返回 `-1`;
4. **正则表达式的应用**
当需要复杂模式匹配或者提取的时候,内置模块 re 提供的强大正则表达式功能成为利器:
python
import re
pattern = r'\d+ years old'
text = "I am 27 years old."
match = re.search(pattern, text)
if match:
result = match.group(0).replace('years', '') # 获取年龄数值
5. **编码解码问题**
针对国际化的需求,Python 的 str 类型默认采用 Unicode 编码,同时提供了 encode()/decode() 函数用于与其他编码如 ASCII, UTF-8 相互转化。
总的来说,深入理解和熟练掌握 Python 对于字符串的支持方式及其强大之处能够极大地提高开发效率并在实际项目中解决各种各样的文本数据处理需求。无论是简单的日志记录还是大规模的数据清洗分析任务都能得心应手。