Pandas Dataframe에서 dtype을 개체로 사용하는 열을 문자열로 변환하는 방법
이 질문에 이미 답변이 있습니다.
- Pandas : Series의 데이터 유형을 String 3 답변으로 변경
csv 파일을 pandas 데이터 프레임으로 읽으면 각 열이 자체 데이터 유형으로 캐스팅됩니다. 개체로 변환 된 열이 있습니다. 이 열에 대해 값 분할 및 목록 생성과 같은 문자열 작업을 수행하고 싶습니다. 그러나 dtype이 객체이기 때문에 그러한 작업은 불가능합니다. 누구든지 열의 모든 항목을 객체 대신 문자열로 변환하는 방법을 알려주시겠습니까?
여러 가지 방법을 시도했지만 효과가 없었습니다. 나는 astype, str (), to_string 등을 사용했습니다.
a=lambda x: str(x).split(',')
df['column'].apply(a)
또는
df['column'].astype(str)
문자열 데이터 유형은 가변 길이를 가지므로 기본적으로 객체 dtype으로 저장됩니다. 문자열 유형으로 저장하려면 다음과 같이 할 수 있습니다.
df['column'] = df['column'].astype('|S80') #where the max length is set at 80 bytes,
또는 대안으로
df['column'] = df['column'].astype('|S') # which will by default set the length to the max len it encounters
열에 다시 할당 해 보셨습니까?
df['column'] = df['column'].astype('str')
이 질문을 참조 하면 pandas 데이터 프레임은 문자열에 대한 포인터를 저장하므로 '객체'유형입니다. 문서에 따라 다음을 시도해 볼 수 있습니다.
df['column_new'] = df['column'].str.split(',')
질문에 직접 답하지는 않지만 다른 사람에게 도움이 될 수 있습니다.
나는라는 컬럼이 Volume
모두 필요 -
로 포맷 (유효 / NaN이를)와 숫자를,
df['Volume'] = df['Volume'].astype('str')
df['Volume'] = df['Volume'].str.replace(',', '')
df['Volume'] = pd.to_numeric(df['Volume'], errors='coerce')
str.replace 에 적용 하려면 문자열로 캐스팅해야합니다 .
pandas.Series.str.
pandas.to_numeric 교체
사용을 시도한 df['column'].str.
다음 문자열 함수를 사용할 수 있습니다. Pandas 문서에는 split 과 같은 문서가 포함됩니다.
df.to_string ()을 사용하십시오.
참조 링크
http://pandas.pydata.org/pandas-docs/version/0.17.0/generated/pandas.DataFrame.to_string.html
'Development Tip' 카테고리의 다른 글
matplotlib에서 플롯, 축 또는 그림을 사용하여 플롯을 그리는 것의 차이점은 무엇입니까? (0) | 2020.11.15 |
---|---|
HTML5 숫자 입력 (클라이언트 측)에서 쉼표 대신 소수점을 사용합니다. (0) | 2020.11.15 |
__repr __ () 함수에 대한 최상의 출력 유형 및 인코딩 방법? (0) | 2020.11.15 |
Windows / Linux에서 Java Swing 앱의 DPI를 설정하는 방법은 무엇입니까? (0) | 2020.11.15 |
"최상위 JSON 어레이"란 무엇이며 보안 위험이있는 이유는 무엇입니까? (0) | 2020.11.15 |