Разбиение строк через split() в Python
Метод Python split() разбивает строку на части, используя специальный разделитель, и возвращает эти части в виде списка.
Синтаксис метода split():
str.split([разделитель [, maxsplit]])
_____________________________________________________________________________________________________
Параметры split()
В методе split() используется не более двух параметров:
- разделитель (необязательный параметр) – строка разбивается на части с помощью указанного символа. Если разделитель не задан, то любая пробельная строка (пробел, новая строка и т.д.) считается разделителем;
- maxsplit (необязательный параметр) определяет максимальное количество частей.
Если в maxsplit имеет значение -1 то, что количество разбиений строки неограниченно.
______________________________________________________________________________________________________
Возвращаемое значение в split()
Метод Python split string разбивает строку с помощью указанного спецсимвола и возвращает список подстрок.
Пример 1: Как split() работает в Python?
text= 'Love thy neighbor' # разделяем строку print(text.split()) grocery = 'Milk, Chicken, Bread' # разделяем запятой print(grocery.split(', ')) # разделяем двоеточием print(grocery.split(':'))
В результате выполнения данной программы с Python split методом вы увидите:
['Love', 'thy', 'neighbor'] ['Milk', 'Chicken', 'Bread'] ['Milk, Chicken, Bread']
______________________________________________________________________________________________________
Пример 2: Выполнение split() при заданном maxsplit:
grocery = 'Milk, Chicken, Bread, Butter' # maxsplit: 2 print(grocery.split(', ', 2)) # maxsplit: 1 print(grocery.split(', ', 1)) # maxsplit: 5 print(grocery.split(', ', 5)) # maxsplit: 0 print(grocery.split(', ', 0))
На выходе получаем результат выполнения метода split Python 3:
['Milk', 'Chicken', 'Bread, Butter'] ['Milk', 'Chicken, Bread, Butter'] ['Milk', 'Chicken', 'Bread', 'Butter'] ['Milk, Chicken, Bread, Butter']
При заданном параметре maxsplit максимальное количество элементов в списке равно maxsplit+1.
Данная публикация представляет собой перевод статьи «Python String split()» , подготовленной дружной командой проекта Интернет-технологии.ру
www.internet-technologies.ru
S = ‘str’; S = «str»; S = »’str»’; S = «»»str»»» | Литералы строк |
S = «s\np\ta\nbbb» | Экранированные последовательности |
S = r»C:\temp\new» | Неформатированные строки (подавляют экранирование) |
S = b»byte» | Строка байтов |
S1 + S2 | Конкатенация (сложение строк) |
S1 * 3 | Повторение строки |
S[i] | Обращение по индексу |
S[i:j:step] | Извлечение среза |
len(S) | Длина строки |
S.find(str, [start],[end]) | Поиск подстроки в строке. Возвращает номер первого вхождения или -1 |
S.rfind(str, [start],[end]) | Поиск подстроки в строке. Возвращает номер последнего вхождения или -1 |
S.index(str, [start],[end]) | Поиск подстроки в строке. Возвращает номер первого вхождения или вызывает ValueError |
S.rindex(str, [start],[end]) | Поиск подстроки в строке. Возвращает номер последнего вхождения или вызывает ValueError |
S.replace(шаблон, замена) | Замена шаблона |
S.split(символ) | Разбиение строки по разделителю |
S.isdigit() | Состоит ли строка из цифр |
S.isalpha() | Состоит ли строка из букв |
S.isalnum() | Состоит ли строка из цифр или букв |
S.islower() | Состоит ли строка из символов в нижнем регистре |
S.isupper() | Состоит ли строка из символов в верхнем регистре |
S.isspace() | Состоит ли строка из неотображаемых символов (пробел, символ перевода страницы (‘\f’), «новая строка» (‘\n’), «перевод каретки» (‘\r’), «горизонтальная табуляция» (‘\t’) и «вертикальная табуляция» (‘\v’)) |
S.istitle() | Начинаются ли слова в строке с заглавной буквы |
S.upper() | Преобразование строки к верхнему регистру |
S.lower() | Преобразование строки к нижнему регистру |
S.startswith(str) | Начинается ли строка S с шаблона str |
S.endswith(str) | Заканчивается ли строка S шаблоном str |
S.join(список) | Сборка строки из списка с разделителем S |
ord(символ) | Символ в его код ASCII |
chr(число) | Код ASCII в символ |
S.capitalize() | Переводит первый символ строки в верхний регистр, а все остальные в нижний |
S.center(width, [fill]) | Возвращает отцентрованную строку, по краям которой стоит символ fill (пробел по умолчанию) |
S.count(str, [start],[end]) | Возвращает количество непересекающихся вхождений подстроки в диапазоне [начало, конец] (0 и длина строки по умолчанию) |
S.expandtabs([tabsize]) | Возвращает копию строки, в которой все символы табуляции заменяются одним или несколькими пробелами, в зависимости от текущего столбца. Если TabSize не указан, размер табуляции полагается равным 8 пробелам |
S.lstrip([chars]) | Удаление пробельных символов в начале строки |
S.rstrip([chars]) | Удаление пробельных символов в конце строки |
S.strip([chars]) | Удаление пробельных символов в начале и в конце строки |
S.partition(шаблон) | Возвращает кортеж, содержащий часть перед первым шаблоном, сам шаблон, и часть после шаблона. Если шаблон не найден, возвращается кортеж, содержащий саму строку, а затем две пустых строки |
S.rpartition(sep) | Возвращает кортеж, содержащий часть перед последним шаблоном, сам шаблон, и часть после шаблона. Если шаблон не найден, возвращается кортеж, содержащий две пустых строки, а затем саму строку |
S.swapcase() | Переводит символы нижнего регистра в верхний, а верхнего – в нижний |
S.title() | Первую букву каждого слова переводит в верхний регистр, а все остальные в нижний |
S.zfill(width) | Делает длину строки не меньшей width, по необходимости заполняя первые символы нулями |
S.ljust(width, fillchar=» «) | Делает длину строки не меньшей width, по необходимости заполняя последние символы символом fillchar |
S.rjust(width, fillchar=» «) | Делает длину строки не меньшей width, по необходимости заполняя первые символы символом fillchar |
S.format(*args, **kwargs) | Форматирование строки |
pythonworld.ru
Разделить строку на список подстрок в python
5 июня 2016 г. 12:05
Если нужно распарсить строку по какому-то символу, то в простом случае можно воспользоваться функцией split(separator=’ ‘):
a = 'python,django,templates' b = a.split(',') # b = ['python', 'django', 'templates']
Но если у нас задача посложнее, например:
a = 'python, django, template tags' b = a.split(',') # b = ['python', ' django', ' template tags']
то появится проблема лишних пробелов.
Итак, рассмотрим следующую задачу: есть форма с одним полем categories, данные которого можно записывать как через запятую, так и каждую с новой строки. Нужно сформировать список введённых данных. Например, данные поля имеют вид:
python, django cms, template tags templates
Видим, что первая строчка состоит из трех элементов, затем лишние абзацы и, наконец, ещё одна категория. С помощью следующего кода можно распарсить данные:
data = form.cleaned_data.get('categories') categories = [] rows = data.splitlines() # разбиваем на строки for row in rows: if row: # избавляемся от пустых строк [categories.append(' '.join(item.split())) for item in row.split(',') if item]
Результат выполнения кода:
categories = ['python', 'django cms', 'template tags', 'templates']
Немного прокомментирую код:
- Для разбиения строк используем splitlines(), который — похож на split(), но использует в качестве разделителя символы перевода каретки (\n и \r).
- Условием if row отсекаем пустые строки.
- Последней строкой кода мы используем генератор списка (без присваивания к переменной — оно нам не надо), чтобы компактнее записать код:
- row.split(‘,’) разбивает строку, используя запятую в качестве разделителя.
- ‘ ‘.join(item.split()) удаляет лишние пробелы между словами
Данный код не претендует на идеальность, но он достаточно читабельный — может, кому и пригодится!
Оцените статью
4.5 из 5 (всего 4 оценки)Спасибо за ваш отзыв!
После нажатия кнопки «Отправить» ваше сообщение будет доставлено мне на почту.
Права на использование материала, расположенного на этой странице https://vivazzi.pro/it/split-python/:
Разрешается копировать материал с указанием её автора и ссылки на оригинал без использования параметра rel="nofollow"
в теге <a>
. Использование:
Автор статьи: Мальцев АртёмСсылка на статью: <a href="https://vivazzi.pro/it/split-python/">https://vivazzi.pro/it/split-python/</a>
Подробнее: Правила использования сайта
Похожие статьи:
Ознакомьтесь с реально работающими финансовыми инструментами
Как разбить строку в Python
Одной из распространенных операций при работе со строками является разбиение строки на массив подстрок с использованием заданного разделителя.В этой статье мы поговорим о том, как разбить строку в Python.
Метод .split ()
В Python строки представлены как неизменяемые strобъекты. Класс str приходит с целым рядом строковых методов , которые позволяют манипулировать строку.
Метод .split() возвращает список подстрок , разделенных разделителем. Он имеет следующий синтаксис:
str.split(delim=None, maxsplit=-1)
Разделитель может быть символом или последовательностью символов, а не регулярным выражением.
В приведенном ниже примере строка s будет разделена с использованием запятой ,в качестве разделителя.
s = 'AndreyEx,Alex,Jon's.split(',')
Результатом будет список строк:
['AndreyEx', 'Alex', 'Jon']
Строковые литералы обычно заключаются в одинарные кавычки, хотя можно использовать и двойные кавычки.
Последовательность символов также может быть использована в качестве разделителя:
s = 'AndreyEx::Alex::Jon's.split('::')
['AndreyEx', 'Alex', 'Jon']
Когда maxsplitдано, это ограничит количество расколов. Если не указано или -1, количество разделений не ограничено.
s = 'AndreyEx;Alex;Jon's.split(';', 1)
Список результатов будет иметь максимум maxsplit+1 элементов:
['AndreyEx', 'Alex;Jon']
Если значение delimне указано или оно есть Null, строка будет разделена с использованием пробела в качестве разделителя. Все последовательные пробелы рассматриваются как один разделитель. Также, если строка содержит конечные и начальные пробелы, результат не будет содержать пустых строк.
Чтобы лучше проиллюстрировать это, давайте рассмотрим следующий пример:
' AndreyEx Hodor Arya Jaime Bran '.split()
['AndreyEx', 'Hodor', 'Arya', 'Jaime', 'Bran']
' AndreyEx Hodor Arya Jaime Bran '.split(' ')
['', 'AndreyEx', '', 'Hodor', 'Arya', '', '', 'Jaime', 'Bran', '']
Если разделитель не используется, возвращаемый список не содержит пустых строк. Если в качестве разделителя задано пустое пространство ‘ ‘, начальные, конечные и последовательные пробелы приведут к тому, что результат будет содержать пустые строки.
Заключение
Разделение строк является одной из самых основных операций. Прочитав этот урок, вы должны хорошо понимать, как разбивать строки в Python.
Если у вас есть какие-либо вопросы или отзывы, не стесняйтесь оставлять комментарии.
Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.
andreyex.ru
используемые методы, функции и операторы, примеры кода
От автора: в Python все является объектом, и строка тоже. Строка Python может быть создана просто с помощью заключения символов в двойные кавычки.
Например:
В этом руководстве мы узнаем:
Бесплатный курс «Python. Быстрый старт»
Получите курс и узнайте, как создать программу для перевода текстов на Python
Получить курсКак получать доступ к значениям в строках
О различных строковых операторах
Еще несколько примеров
О методе Python String replace()
Как приводить строки к верхнему и нижнему регистру
Об использование для строки функцию «join»
О реверсе строк
О разделении строк
Доступ к значениям в строках
Python не поддерживает тип символов, они обрабатываются как одна строка, а также рассматриваются как подстроки. Мы используем для разбивки квадратные скобки вместе с индексом или индексами, чтобы получить подстроки.
var1 = «Guru99!» var2 = «Software Testing» print («var1[0]:»,var1[0]) print («var2[1:5]:»,var2[1:5])
var1 = «Guru99!» var2 = «Software Testing» print («var1[0]:»,var1[0]) print («var2[1:5]:»,var2[1:5]) |
Различные строковые операторы
Существуют различные строковые операторы, которые можно использовать по-разному, например, объединять строки. Предположим, что если a=guru, а b=99, то a+b= «guru99″. Точно так же, если вы используете *2, это будет «GuruGuru». Также вы можете использовать другие операторы.
Оператор []. Описание: Фрагмент — дает символ с данным индексом. Пример: a[1] дает «u» из слова Guru, так как (0=G, 1=u, 2=r и 3=u).
Оператор [:]. Описание: Диапазон фрагментов — дает символы из заданного диапазона. Пример: x[1:3] даем «ur» из слова гуру Guru. Помните, что это не учитывать 0, который является G, это будет учитывать буквы после него.
Оператор in. Описание: Содержит — возвращает true, если в заданной строке есть буква.
Оператор not in. Описание: Не содержит -возвращает true, если буква не существует в данной строке. Пример: l не присутствует в слове Guru и, следовательно, это даст 1.
x=»Guru» print «l» not in x
x=»Guru» print «l» not in x |
Оператор r/R. Описание: Необработанная строка подавляет фактическое значение escape-символов. Пример: Напечатайте r’\n’ печатает \n и напечатайте R’\n’ печатает \n.
name = ‘guru’ number = 99 print’%s %d’ % (name,number)
name = ‘guru’ number = 99 print’%s %d’ % (name,number) |
Оператор +. Описание: Объединение 2 строк. Пример: Объединяет строки и дает результат.
x=»Guru» y=»99″ print x+y
x=»Guru» y=»99″ print x+y |
Оператор *. Описание: Повторение. Пример: Выводит символ дважды.
x=»Guru» y=»99″ print x*2
x=»Guru» y=»99″ print x*2 |
Еще несколько примеров
Вы можете обновить строку Python, переназначив переменную другой строке. Новое значение может быть связано с предыдущим значением или с совершенно другой строкой.
x = «Hello World!» print(x[:6]) print(x[0:6] + «Guru99»)
x = «Hello World!» print(x[:6]) print(x[0:6] + «Guru99») |
Примечание: — Slice:6 или 0:6 дает тот же результат.
Метод строк Python replace()
Метод replace() возвращает копию строки, в которой значения старой строки были заменены новым значением.
oldstring = ‘I like Guru99’ newstring = oldstring.replace(‘like’, ‘love’) print(newstring)
oldstring = ‘I like Guru99’ newstring = oldstring.replace(‘like’, ‘love’) print(newstring) |
Бесплатный курс «Python. Быстрый старт»
Получите курс и узнайте, как создать программу для перевода текстов на Python
Получить курсИзменение верхнего и нижнего регистра строк
В Python вы можете даже привести строку к верхнему или нижнему регистру.
string=»python at guru99″ print(string.upper())
string=»python at guru99″ print(string.upper()) |
Кроме того, вы также можете использовать другую функцию, такую как capitalize:
string=»python at guru99″ print(string.capitalize())
string=»python at guru99″ print(string.capitalize()) |
Вы также можете преобразовать строку в нижний регистр:
string=»PYTHON AT GURU99″ print(string.lower())
string=»PYTHON AT GURU99″ print(string.lower()) |
Использование для строки функции «join»
Функция join является более гибким способом объединения строк. С помощью функции join вы можете добавить в строку любой символ.
Например, если вы хотите добавить двоеточие (:) после каждого символа в строке «Python», вы можете использовать следующий код.
print(«:».join(«Python»))
print(«:».join(«Python»)) |
Реверс строк
Используя функцию реверса, вы можете перевернуть строку. Например, если у нас есть строка «12345», а затем, если вы применяете код для обратной функции, как показано ниже.
string=»12345″ print(».join(reversed(string)))
string=»12345″ print(».join(reversed(string))) |
Разделение строк
Разделение строк — это еще одна функция, которая может применяться в Python, давайте посмотрим на строку «guru99 career guru99″. Сначала мы разделим строку с помощью команды word.split и получим результат.
word=»guru99 career guru99″ print(word.split(‘ ‘))
word=»guru99 career guru99″ print(word.split(‘ ‘)) |
Чтобы лучше это понять, мы рассмотрим еще один пример разделения, вместо пробела (») мы используем (‘r’), и это будет разбивать строку везде, где в строке встречается ‘r’:
word=»guru99 career guru99″ print(word.split(‘r’))
word=»guru99 career guru99″ print(word.split(‘r’)) |
Важное примечание: В Python строки являются неизменяемыми. Рассмотрим следующий код:
x = «Guru99″ x.replace(«Guru99″,»Python») print(x)
x = «Guru99» x.replace(«Guru99″,»Python») print(x) |
все равно возвращает Guru99. Это связано с тем, что x.replace («Guru99″, «Python») возвращает копию X с выполненными заменами. Вам нужно будет использовать следующий код, чтобы увидеть изменения:
x = «Guru99″ x = x.replace(«Guru99″,»Python») print(x)
x = «Guru99» x = x.replace(«Guru99″,»Python») print(x) |
Приведенные выше коды являются примерами Python 3. Если вы хотите запустить Python 2, рассмотрите следующий код.
#Accessing Values in Strings var1 = «Guru99!» var2 = «Software Testing» print «var1[0]:»,var1[0] print «var2[1:5]:»,var2[1:5] #Some more examples x = «Hello World!» print x[:6] print x[0:6] + «Guru99″ #Python String replace() Method oldstring = ‘I like Guru99’ newstring = oldstring.replace(‘like’, ‘love’) print newstring #Changing upper and lower case strings string=»python at guru99″ print string.upper() string=»python at guru99″ print string.capitalize() string=»PYTHON AT GURU99″ print string.lower() #Using «join» function for the string print»:».join(«Python») #Reversing String string=»12345″ print».join(reversed(string)) #Split Strings word=»guru99 career guru99″ print word.split(‘ ‘) word=»guru99 career guru99″ print word.split(‘r’) x = «Guru99″ x.replace(«Guru99″,»Python») print x x = «Guru99″ x = x.replace(«Guru99″,»Python») print x
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 | #Accessing Values in Strings var1 = «Guru99!» var2 = «Software Testing» print «var1[0]:»,var1[0] print «var2[1:5]:»,var2[1:5] #Some more examples x = «Hello World!» print x[:6] print x[0:6] + «Guru99» #Python String replace() Method oldstring = ‘I like Guru99’ newstring = oldstring.replace(‘like’, ‘love’) print newstring #Changing upper and lower case strings string=»python at guru99″ print string.upper() string=»python at guru99″ print string.capitalize() string=»PYTHON AT GURU99″ print string.lower() #Using «join» function for the string print»:».join(«Python») #Reversing String string=»12345″ print».join(reversed(string)) #Split Strings word=»guru99 career guru99″ print word.split(‘ ‘) word=»guru99 career guru99″ print word.split(‘r’) x = «Guru99» x.replace(«Guru99″,»Python») print x x = «Guru99» x = x.replace(«Guru99″,»Python») print x |
В Python появилась функция .format, которая позволяет использовать %d и т. д. для форматирования строк.
Заключение
Поскольку Python является объектно-ориентированным языком программирования, многие функции могут быть применены к объектам Python. Примечательной особенностью Python являются отступы исходных операторов, облегчающие чтение кода.
Доступ к значениям через разделение — квадратные скобки используются для нарезки вместе с индексом или индексами для получения подстроки.
В нарезке, если диапазон объявлен [1: 5], он может фактически извлечь значение из диапазона [1: 4]
Вы можете обновить строку Python, переназначив переменную другой строке
Метод replace() возвращает копию строки, в которой вхождение старых символов заменяется новыми.
Синтаксис для метода replace: oldstring.replace(«значение, на которое заменяем», «значение, которое заменяем»)
Строковые операторы, такие как [], [:], in, Not in и т. д., могут применяться для конкатенации строки, извлечения или вставки определенных символов в строку или для проверки того, существует ли определенный символ в строке
Другие строковые операции включают:
Изменение верхнего и нижнего регистра
Функция Join, чтобы добавить любой символ в строку
Реверс строк
Разделение строк
Источник: https://www.guru99.com
Редакция: Команда webformyself.
Бесплатный курс «Python. Быстрый старт»
Получите курс и узнайте, как создать программу для перевода текстов на Python
Получить курсwebformyself.com
Методы строк в Python
В Python у разных типов данных есть свои методы (функции), специфичные для этого типа данных. И раз уж на прошлом уроке мы начали знакомиться со строками, то никак не пройти и мимо методов строк.
Вызов метода в Python
Для вызова метода, прибавляем точку к переменной, для которой данный метод вызывается, пишем само название метода и передаем в скобочках аргументы.
переменная.метод(аргументы)
Поиск подстроки в строке Python
Для поиска подстроки в строке в Python, есть четыре метода:
- find()
- rfind()
- index()
- rindex()
Метод find() ищет индекс подстроки в строке — возвращает номер позиции символа указанного в аргументах.
>>> s='Найти подстроку'
>>> s.find('и')
4
В случае нескольких символов идущих подряд, Python вернет позицию, с которой начинается полное совпадение.
>>> s.find('под')
6
При обращении к несуществующей подстроке, вернется значение -1.
>>> s.find('ю')
-1
Метод index() тоже ищет подстроку в строке по её индексу, но в случае поиска несуществующей подстроки в отличии от find(), возвращает ошибку ValueError.
Методы rfind() и rindex() ищут подстроку с конца строки — справа.
>>> s.rfind('т')
10
Замена символа в строке
Метод replace() заменяет одни символы на другие, где первым параметром передаем, что заменить. А во втором параметре указываем , на что заменить.
>>> s.replace('ти','**')
'Най** подстроку'
Как удалить символ из строки?
Передадим во втором параметре пустые кавычки.
>>> s.replace('п','')
'Найти одстроку'
Как удалить пробелы в строке?
Первым параметром указываем пробел, а вторым параметром — пустые кавычки.
>>> s.replace(' ','')
'Найтиподстроку'
Разделить строку в Python
По умолчанию метод split() разделяет строку по пробелам и преобразует строку в список. В итоге мы получили список из трех элементов.
>>> h='разбить строку питон'
>>> h.split()
['разбить', 'строку', 'питон']
Разделить строку можно по любому другому символу, для этого передадим нужный символ в параметрах. При этом, сам символ удаляется из списка.
# Пример 1 - разделить по тире "-">>> p='питон-1 питон-2'
>>> p.split('-')
['питон', '1 питон', '2']
# Пример 2 - разделить по букве "t"
>>> c='method split in python'
>>> c.split('t')
['me', 'hod spli', ' in py', 'hon']
Объединить строки в Python
Несмотря на то, что метод join() является не строковым методом. Мы все равно его изучим в рамках данного урока. Поскольку join() в Python выполняет противоположную функцию метода split(). Берет элементы списка и преобразует список в строку. Имя переменной, ссылающейся на список строк — единственный передаваемый параметр метода join(). Перед точкой, мы указали разделитель — пустые кавычки.
>>> a=['1', '2', '3', '4', '5']
>>> ''.join(a)
'12345'# разделитель пробел
>>> ' '.join(a)
'1 2 3 4 5'
# разделитель запятая
>>> ','.join(a)
'1,2,3,4,5'
Метод join() не работает с числовыми данными. Следующая запись приведет к ошибке.
a=[6, 7, 8]
' '.join(a)
Перед использованием метода join(), следует числа привести к строкам.
>>> e=['9', '10']
>>> ' '.join(e)
'9 10'
Верхний регистр строки в Python
Метод upper() приводит все буквы строки к верхнему регистру, не меняя остальных символов.
>>> w='верхний регистр'
>>> w.upper()
'ВЕРХНИЙ РЕГИСТР'
Нижний регистр строки в Python
Метод lower() приводит все буквы строки к нижнему регистру.
>>> r='НИЖНИЙ РЕГИСТР'
>>> r.lower()
'нижний регистр'
Подсчет количества символов
Метод count() считает, сколько раз встречается подстрока в строке, указанная в параметрах.
>>> y="посчитать количество слов"
>>> y.count('о')
3
Проверка символов в строке
Метод isalpha() проверяет, состоит ли строка только из букв и возвращает истину или ложь.
>>> i='толькобуквы'
>>> i.isalpha()
True
Метод isdigit() проверяет, состоит ли строка только из цифр и возвращает истину или ложь.
>>> f='23456hbbn'
>>> f.isdigit()
False
- Создано 30.10.2019 10:53:26
- Михаил Русаков
Копирование материалов разрешается только с указанием автора (Михаил Русаков) и индексируемой прямой ссылкой на сайт (http://myrusakov.ru)!
Добавляйтесь ко мне в друзья ВКонтакте: http://vk.com/myrusakov.
Если Вы хотите дать оценку мне и моей работе, то напишите её в моей группе: http://vk.com/rusakovmy.
Если Вы не хотите пропустить новые материалы на сайте,
то Вы можете подписаться на обновления: Подписаться на обновления
Если у Вас остались какие-либо вопросы, либо у Вас есть желание высказаться по поводу этой статьи, то Вы можете оставить свой комментарий внизу страницы.
Если Вам понравился сайт, то разместите ссылку на него (у себя на сайте, на форуме, в контакте):
myrusakov.ru
методы для форматирования и преобразование в строку
Строками в языках программирования принято называть упорядоченные последовательности символов, которые используются для представления любой текстовой информации. В Python они являются самостоятельным типом данных, а значит при помощи встроенных функций языка над ними можно производить различные операции и форматировать их для вывода.
Создание
Получить новую строку можно несколькими способами: при помощи соответствующего литерала либо же вызвав готовую функцию. Для начала рассмотрим первый метод, который продемонстрирован ниже. Здесь переменная string получает значение some text, благодаря оператору присваивания. Вывести на экран созданную строку помогает функция print.
string = 'some text' print(string) some text
Как видно из предыдущего примера, строковый литерал обрамляется в одиночные кавычки. Если необходимо, чтобы данный символ был частью строки, следует применять двойные кавычки, как это показано в следующем фрагменте кода. Из результатов его работы видно, что новая строка включает в себя текст some ‘new’ text, который легко выводится на экран.
string = "some 'new' text" print(string) some 'new' text
Иногда возникает потребность в создании объектов, включающих в себя сразу несколько строк с сохранением форматирования. Эту задачу поможет решить троекратное применение символа двойных кавычек для выделения литерала. Объявив строку таким образом, можно передать ей текст с неограниченным количеством абзацев, что показано в данном коде.
string = """some 'new' text with new line here""" print(string) some 'new' text with new line here
Специальные символы
Пользоваться тройными кавычками для форматирования строк не всегда удобно, так как это порой занимает слишком много места в коде. Чтобы задать собственное форматирование текста, достаточно применять специальные управляющие символы с обратным слэшем, как это показано в следующем примере. Здесь используется символ табуляции \t, а также знак перехода на новую строку \n. Метод print демонстрирует вывод нового объекта на экран.
string = "some\ttext\nnew line here" print(string) some text new line here
Служебные символы для форматирования строк выполняют свои функции автоматически, но иногда это мешает, к примеру, когда требуется сохранить путь к файлу на диске. Чтобы их отключить, необходимо применить специальный префикс r перед первой кавычкой литерала. Таким образом, обратные слэши будут игнорироваться программой во время ее запуска.
string = r"D:\dir\new"
Следующая таблица демонстрирует перечень всех используемых в языке Python служебных символов для форматирования строк. Как правило, большинство из них позволяют менять положение каретки для выполнения перевода строки, табуляции или возврата каретки.
Символ | Назначение |
\n | Перевод каретки на новую строку |
\b | Возврат каретки на один символ назад |
\f | Перевод каретки на новую страницу |
\r | Возврат каретки на начало строки |
\t | Горизонтальная табуляция |
\v | Вертикальная табуляция |
\a | Подача звукового сигнала |
\N | Идентификатор базы данных |
\u, \U | 16-битовый и 32-битовый символ Unicode |
\x | Символ в 16-ричной системе исчисления |
\o | Символ в 8-ричной системе исчисления |
\0 | Символ Null |
Очень часто испльзуется \n. С помощью него осуществляется в Python перенос строки. Рассмотрим пример:
print('first\nsecond') first second
Форматирование
Выполнить форматирование отдельных частей строки, задав в качестве ее компонентов некие объекты программы позволяет символ %, указанный после литерала. В следующем примере показано, как строковый литерал включает в себя не только текст, но также строку и целое число. Стоит заметить, что каждой переменной в круглых скобках должен соответствовать специальный символ в самом литерале, обладающий префиксом % и подходящим значением.
string = "text" number = 10 newString = "this is %s and digit %d" % (string, number) print(newString) this is text and digit 10
В приведенном ниже фрагменте кода демонстрируется использование форматирования для вывода строки с выравниванием по правому краю (общая длина символов указана как 10).
string = "text" newString = "%+10s" % string print(newString) text
Данная таблица содержит в себе все управляющие символы для форматирования строк в Python, каждый из которых обозначает определенный объект: числовой либо же символьный.
Символ | Назначение |
%d, %i, %u | Число в 10-ричной системе исчисления |
%x, %X | Число в 16-ричной системе исчисления с буквами в нижнем и верхнем регистре |
%o | Число в 8-ричной системе исчисления |
%f, %F | Число с плавающей точкой |
%e, %E | Число с плавающей точкой и экспонентой в нижнем и верхнем регистре |
%c | Одиночный символ |
%s, %r | Строка из литерала и обычная |
%% | Символ процента |
Более удобное форматирование выполняется с помощью функции format. Ей необходимо передать в качестве аргументов объекты, которые должны быть включены в строку, а также указать места их расположения с помощью числовых индексов, начиная с нулевого.
string = "text" number = 10 newString = "this is {0} and digit {1}".format(string, number) print(newString) this is text and digit 10
В следующем примере показано как можно отцентрировать строку, воспользовавшись методом format и специальными символами. Изначальный текст здесь перемещается в самый центр строки, в то время как пустое пространство заполняется символом *.
string = "text" newString = "{:*^10}".format(string) print(newString) ***text***
Следующая таблица отображает специальные символы для выравнивания строк и вывода чисел с необходимым форматом знаков для положительных и отрицательных объектов.
Символ | Назначение |
‘<‘ | Выравнивание строки по левому краю с символами-заполнителями справа |
‘>’ | Выравнивание строки по правому краю с символами-заполнителями слева |
‘=’ | Выравнивание с символами-заполнителями после знака числа, но перед его цифрами |
‘^’ | Выравнивание строки по центру с символами-заполнителями с обеих сторон |
‘+’ | Применение знака для любых чисел |
‘-‘ | Применение знака для отрицательных чисел и ничего для положительных |
‘ ‘ | Применение знака для отрицательных чисел и пробела для положительных |
Операции над строками
Прежде чем перейти к функциям для работы со строками, следует рассмотреть основные операции с ними, которые позволяют быстро преобразовывать любые последовательности символов. При помощи знака плюс можно производить конкатенацию строк, соединяя их вместе. В следующем примере продемонстрировано объединение this is new и text.
string = "text" newString = "this is new " + string print(newString) this is new text
Пользуясь символом умножения, программист получает возможность дублировать строку любое количество раз. В данном коде слово text записывается в новую строку трижды.
string = "text " newString = string * 3 print(newString) text text text
Как и в случае с числами, со строками можно использовать операторы сравнения, например двойное равно. Очевидно, что литералы some text и some new text разные, поэтому вызов метода print выводит на экран булево значение False для строк string и newString.
string = "some text" newString = "some new text" print(string == newString) False
Операции над строками позволяют получать из них подстроки, делая срезы, как с обычными элементами последовательностей. В следующем примере, необходимо лишь указать нужный интервал индексов в квадратных скобках, помня, что нумерация осуществляется с нуля.
string = "some text" newString = string[2:4] print(newString) me
Отрицательный индекс позволяет обращаться к отдельным символами строки не с начала, а с конца. Таким образом, элемент под номером -2 в строке some text является буквой x.
string = "some text" print(string[-2]) x
Методы и функции
Очень часто используется для приведения типов к строковому виду функция str. С ее помощью можно создать новую строку из литерала, который передается в качестве аргумента. Данный пример демонстрирует инициализацию переменной string новым значением some text.
string = str("some text") print(string) some text
Аргументом этой функции могут быть переменные разных типов, например числа или списки. Эта функция позволяет в Python преобразовать в строку разные типы данных. Если вы создаете свой класс, то желательно определить для него метод __str__. Этот метод должен возвращать строку, которая будет возвращена в случае, когда в качестве аргумента str будет использован объект вашего класса.
В Python получения длины строки в символах используется функция len. Как видно из следующего фрагмента кода, длина объекта some text равняется 9 (пробелы тоже считаются).
string = "some text" print(len(string)) 9
Метод find позволяет осуществлять поиск в строке. При помощи него в Python можно найти одиночный символ или целую подстроку в любой другой последовательности символов. В качестве результата своего выполнения он возвращает индекс первой буквы искомого объекта, при этом нумерация осуществляется с нуля.
string = "some text" print(string.find("text")) 5
Метод replace служит для замены определенных символов или подстрок на введенную программистом последовательность символов. Для этого необходимо передать функции соответствующие аргументы, как в следующем примере, где пробелы заменяются на символ ‘-‘.
string = "some text" print(string.replace(" ", "-")) some-text
Для того чтобы разделить строку на несколько подстрок при помощи указанного разделителя, следует вызвать метод split. По умолчанию его разделителем является пробел. Как показано в приведенном ниже примере, some new text трансформируется в список строк strings.
string = "some new text" strings = string.split() print(strings) ['some', 'new', 'text']
Выполнить обратное преобразование, превратив список строк в одну можно при помощи метода join. В следующем примере в качестве разделителя для новой строки был указан пробел, а аргументом выступил массив strings, включающий some, new и text.
strings = ["some", "new", "text"] string = " ".join(strings) print(string) some new text
Наконец, метод strip используется для автоматического удаления пробелов с обеих сторон строки, как это показано в следующем фрагменте кода для значения объекта string.
string = " some new text " newString = string.strip() print(newString) some new text
Ознакомиться с функциями и методами, используемыми в Python 3 для работы со строками можно из данной таблицы. В ней также приведены методы, позволяющие взаимодействовать с регистром символов.
Метод | Назначение |
str(obj) | Преобразует объект к строковому виду |
len(s) | Возвращает длину строки |
find(s, start, end), rfind(s, start, end) | Возвращает индекс первого и последнего вхождения подстроки в s или -1, при этом поиск идет в границах от start до end |
replace(s, ns) | Меняет выбранную последовательность символов в s на новую подстроку ns |
split(c) | Разбивает на подстроки при помощи выбранного разделителя c |
join(c) | Объединяет список строк в одну при помощи выбранного разделителя c |
strip(s), lstrip(s), rstrip(s) | Убирает пробелы с обоих сторон s, только слева или только справа |
center(num, c), ljust(num, c), rjust(num, c) | Возвращает отцентрированную строку, выравненную по левому и по правому краю с длиной num и символом c по краям |
lower(), upper() | Перевод всех символов в нижний и верхний регистр |
startwith(ns), endwith(ns) | Проверяет, начинается ли или заканчивается строка подстрокой ns |
islower(), isupper() | Проверяет, состоит ли строка только из символов в нижнем и верхнем регистре |
swapcase() | Меняет регистр всех символов на противоположный |
title() | Переводит первую букву каждого слова в верхний регистр, а все остальные в нижний |
capitalize() | Переводит первую букву в верхний регистр, а все остальные в нижний |
isalpha() | Проверяет, состоит ли только из букв |
isdigit() | Проверяет, состоит ли только из цифр |
isnumeric() | Проверяет, является ли строка числом |
Кодировка
Чтобы задать необходимую кодировку для используемых в строках символов в Python достаточно поместить соответствующую инструкцию в начало файла с кодом, как это было сделано в следующем примере, где используется utf-8. С помощью префикса u, который стоит перед литералом, можно помечать его соответствующей кодировкой. В то же время префикс b применяется для литералов строк с элементами величиной в один байт.
# coding: utf-8 string = u'some text' newString = b'text'
Производить кодирование и декодирование отдельных строк с заданной кодировкой позволяют встроенные методы decode и encode. Аргументом для них является название кодировки, как в следующем примере кода, где применяется наименование utf-8.
string = string.decode('utf8') newString = newString.encode('utf8')
all-python.ru