이번에는 자바의 배열과 유사한 리스트에 대해서 정리해보자
리스트란?
여러 개의 데이터를 연속적으로 담아 처리하기 위해 사용하는 자료형이다.
사용자의 입장에서 C나 자바에서의 배열(Array)의 기능 및 연결 리스트와 유사한 기능을 지원한다.
C++의 STL vector와 기능적으로 유사하다.
리스트 대신에 배열 혹은 테이블이라고 부르기도 한다.
리스트는 대괄호([])안에 원소를 넣어 초기화하며, 쉼표(,)로 원소를 구분한다.
비어 있는 리스트를 선언하고자 할 때는 list() 혹은 간단히 []를 이용할 수 있다.
리스트의 원소에 접근할 때는 인덱스(Index) 값을 괄호에 넣는다.
인덱스는 0부터 시작한다.
리스트 초기화
# 직접 데이터를 넣어 초기화
a = [1, 2, 3, 4, 5, 6, 7, 8, 9,]
print(a)
# 네 번째 원소만 출력
print(a[3])
# 크기가 N이고, 모든 값이 0인 1차원 리스트 초기화
n = 10
a = [0] * n
print(a)
리스트의 인덱싱과 슬라이싱
인덱스 값을 입력하여 리스트의 특정한 원소에 접근하는 것을 인덱싱(Indexing)이라고 한다.
파이썬의 인덱스 값은 양의 정수와 음의 정수를 모두 사용할 수 있다.
음의 정수를 넣으면 원소를 거꾸로 탐색하게 된다.
a = [1, 2, 3, 4, 5, 6, 7, 8, 9]
# 여덟 번째 원소만 출력
print(a[7])
# 뒤에서 첫 번째 원소 출력
print(a[-1])
# 뒤에서 세 번째 원소 출력
print(a[-3])
# 네 번째 원소값 변경
a[3] = 7
print(a)
리스트에서 연속적인 위치를 갖는 원소들을 가져와야 할 때는 슬라이싱(Slicing)을 이용한다.
대괄호 안에 콜론(:)을 넣어서 시작 인덱스와 끝 인덱스를 설정할 수 있다.
끝 인덱스는 실제 인덱스보다 1을 크게 설정한다.
a = [1, 2, 3, 4, 5, 6, 7, 8, 9]
# 네 번째 원소만 출력
print(a[3])
# 두 번째 원소부터 네 번째 원소까지
print(a[1:4])
리스트 컴프리헨션
리스트를 초기화하는 방법 중 하나이다.
대괄호 안에 조건문과 반복문을 적용하여 리스트를 초기화할 수 있다.
# 0부터 9까지의 수를 포함하는 리스트
array = [i for i in range(10)]
print(array)
# 0부터 19까지의 수 중에서 홀수만 포함하는 리스트
array = [i for i in range(20) if i % 2 == 1]
print(array) # [1, 3, 5, 7, 9, 11, 13, 15, 17, 19]
# 1부터 9까지의 수들의 제곱 값을 포함하는 리스트
array = [i * i for i in range(1, 10)]
print(array) # [1, 4, 9, 16, 25, 36, 49, 64, 81]
리스트 컴프리헨션과 일반적인 코드 비교하기
코드 1: 리스트 컴프리헨션
# 0부터 19까지의 수 중에서 홀수만 포함하는 리스트
array = [i for i in range(20) if i % 2 ==1]
print(array)
코드 2: 일반적인 코드
# 0부터 19까지의 수 중에서 홀수만 포함하는 리스트
array = []
for i in range(20):
if i % 2 == 1:
array.append(i)
print(array)
리스트 컴프리헨션은 2차원 리스트를 초기화할 때 효과적으로 사용될 수 있다.
특히 N x M 크기의 2차원 리스트를 한 번에 초기화할 때 매우 유용하다.
좋은 예시: array = [[0]*m for_in range(n)]
만약 2차원 리스트를 초기화할 때 다음과 같이 작성하면 예기치 않은 결과가 나올 수 있다.
잘못된 예시: array = [[0]*m]*n
위 코드는 전체 리스트 안에 포함된 각 리스트가 모두 같은 객체로 인식된다.
리스트 컴프리헨션 (좋은 예시)
# N x M 크기의 2차원 리스트 초기화
n = 4
m = 3
array = [[0]*m for _ in range(n)]
print(array)
리스트 컴프리헨션 (잘못된 예시)
# N x M 크기의 2차원 리스트 초기화 (잘못된 방법)
n = 3
m = 4
array = [[0]*m]*n
array[1][1] = 5
print(array)
# [[0, 5, 0], [0, 5, 0], [0, 5, 0], [0, 5, 0]]
언더바는 언제 사용할까?
파이썬에서는 반복을 수행하되 반복을 위한 변수의 값을 무시하고자 할 때 언더바(_)를 자주 사용한다.
# 1부터 9까지의 자연수 더하기
summary = 0
for i in range(1, 10):
summary += i
print(summary)
# "Hello World"를 5번 출력하기
for _ in range(5):
print("Hello World")
리스트 관련 기타 메서드
| 함수명 | 사용법 | 설명 | 시간 복잡도 |
| append() | 변수명.append() | 리스트에 원소를 하나 삽입할 때 사용 | O(1) |
| sort() | 변수명.sort() 변수명.sort(reverse=True) |
기본 정렬 기능으로 오름차순으로 정렬 내림차순으로 정렬 |
O(NlongN) |
| reverse() | 변수명.reverse() | 리스트의 원소의 순서를 모두 뒤집어 놓는다. | O(N) |
| insert() | insert(삽입할 위치 인덱스, 삽입 할 값) | 특정한 인덱스 위치에 원소를 삽입할 때 사용 | O(M) |
| count() | 변수명.count(특정값) | 리스트에서 특정한 값을 가지는 데이터의 개수를 셀 때 사용 | O(M) |
| remove | 변수명.remove(특정값) | 특정한 값을 갖는 원소를 제거하는데, 값을 가진 원소가 여러 개면 하나만 제거 | O(M) |
a = [4, 3, 2, 1]
# 리스트 원소 뒤집기
a.reverse()
print("원소 뒤집기: ", a)
# 특정 인덱스에 데이터 추가
a.insert(2, 3)
print("인덱스 2에 3추가: ", a)
# 특정 값인 데이터 개수 세기
print("값이 3인 데이터 개수: ", a.count(3))
# 특정 값 데이터 삭제
a.remove(1)
print("값이 1인 데이터 삭제: ", a)
리스트에서 특정 값을 가지는 원소를 모두 제거하기
a = [1, 2, 3, 4, 5, 5, 5]
remove_set = {3, 5} # 집합 자료형
# remove_set에 포함되지 않는 값만을 저장
result = [i for i in a if i not in remove_set]
print(result)
'Programming > Python' 카테고리의 다른 글
| [Python] 사전, 집합 자료형 (0) | 2023.03.21 |
|---|---|
| [Python] 사전, 집합 자료형 (0) | 2023.03.20 |
| [Python] 문자열, 튜플 자료형 (0) | 2023.03.20 |
| [Python] 수 자료형 (0) | 2023.03.15 |