보통은 데이터와 그에 해당하는 특징을 표현할 때 하나의 데이터를 한 묶음으로 feature을 열거하겠다. 예시를 들면 다음과 같다.
Data = [ [사람 1의 나이, 키, 사는 곳], [사람 2의 나이, 키, 사는 곳], ...]
어느 i번째 데이터를 나타내려면 간단히 Data[i] 하면 되겠다.
그렇다면 "나이" 항목만 추출하여 [사람1의 나이, 사람 2의 나이, ...] 와 같은 식으로는 어떻게 나타낼까?
for문을 돌리지 않고 나타낼 수 있는 경우에 한해 포스팅한다.
1) 데이터는 실제로 txt나 csv에서 정보를 제공해주기도 하므로 pandas를 써서 나타내면 아래와 같다.
Data = [[25, 175, "Seoul"],[40, 166, "Gwanju"], [15, 160, "Busan"]]
import pandas as pd
df= pd.DataFrame()[0]
df.to_list()
# [25, 40, 15]
2) zip을 써서도 나타낼 수 있는데 output은 tuple 형태이다. 만일 out을 list 형태로 나타내고 싶으면 list()로 감싸주면 되겠다.
age = list(zip(*Data))[0]
# age = (25, 40, 15)
출처 :https://emilkwak.github.io/python-2d-list-certain-column
'딥러닝 꿀팁' 카테고리의 다른 글
딥러닝 iteration 돌다가 중간에 죽었음 뜰 때는 pin_memory를 먼저 보라 (0) | 2024.02.27 |
---|---|
Pytorch에서 쓸 때마다 헷갈리는 unfold, fold 정리 (2) | 2024.01.09 |
for문과 같은 loop문 없이 tensor을 특정 조건으로 훑고 선택 및 변경하기 (1) | 2023.07.10 |
왜 torch.zeros를 쓰지 않고 torch.new_zeros를 사용할까 (0) | 2023.05.16 |
모델을 Evaluation시 필수적으로 넣어줘야 할 것 (0) | 2023.05.16 |