gogoring

minju0611 · minju0611 · commit 9a75d201f3f4 · 2025-02-02T03:52:57.000+09:00
diff --git a/_posts/2025-01-23-[Pandas] 07. 데이터가공 날짜.md b/_posts/2025-01-23-[Pandas] 07. 데이터가공 날짜.md
@@ -150,7 +150,7 @@ df['Time Shift1'] = df['Temp'].shift(1)
 df['pct change'] = (df['Time Shift1'] - df["Temp"]) / df['Temp']
 ```
 
-# apply, map, 문자열
+# 08. apply, map, 문자열
 
 titanic_train.csv 사용
 
@@ -238,6 +238,7 @@ df2.loc[miss_mask]
 df2["Name"] = df2["Name"].str.replace(",", "⭐️")
 ```
 
+<<<<<<< Updated upstream
 # 09. 데이터 결합 
 
 korean-idol_csv 사용
@@ -270,12 +271,46 @@ pd.concat([df1, df3], axis=1 ) # 값이 결합 될 수 없는 곳엔 Nan값이 
 
 ### left, right
 - 기준이 왼쪽, 기준이 오른쪽
+=======
+# 09. 데이터 결합
+
+## concat
+### row 기준 합치기 
+- aixs = 0 
+- 행 데이터의 생성 방향, 아래쪽 
+- 열 인덱스 기준으로 결합
+
+```python
+df1_concat = pd.concat([df1, df1_copy], axis = 0)
+df1_concat.reset_index(drop=True) # 기존에 사용하던 인덱스를 drop하고 인덱스 리셋
+```
+
+### column 기준 합치기
+- axis = 1 
+- 열 데이터의 생성 방향, 옆쪽
+- 행 인덱스 기준으로 결합
+
+```python
+pd.concat([df1, df2], axis = 1) # 열방향(옆으로), 행 인덱스가 같은 것 끼리
+```
+
+## merge
+- `concat`: `row`나`column`기준으로 단순하게 이어 붙이기 
+- `merge`: 특정한 고유 키(`unique id`)값을 기준으로 병합
+
+`pd.merge(left, right, on='기준 컬럼', how='left')
+- `left`, `right` : 병합할 두 DataFrame
+- `on`: 병합의 기준이 되는 컬럼의 이름
+    - 기준이 되는 데이터프레임은 삭제가 일어나지 않음!!!
+- `how`: `left, right, inner, outer` 4가지의 병합방식 설정 
+>>>>>>> Stashed changes
 
 ```python
 pd.merge(
   df1,
   df2_right,
   on = '이름',
+<<<<<<< Updated upstream
   how = 'left' # left에 위치한 df1이 기준이 된다. 기준이 된 데이터프레임은 데이터의 삭제가 일어나지 않음..!!!!!
 )
 
@@ -299,4 +334,21 @@ pd.merge(df1_left, df2_right, on='이름', how="inner") # 왼,오 데이터프
 
 ```python
 pd.merge(df1_left, df2_right, on="이름", how="outer") # 한 쪽만 키값(이름)이 있어도 생성되고, 없는 값은 Nan값 처리
+=======
+  how = 'left' # left에 위치한 df1이 기준이 됨. 기준이 된 데이터프레임은 삭제가 일어나지 않음!!!
+)
+```
+### inner, outer 형식
+- `inner`: 두 데이터 프레임에 모두 키 값이 존재하는 경우 병합
+- `outer`: 하나의 데이터 프레임에 키 값이 존재하는 경우 모두 병합
+    - 없는 값은 NaN값으로 대입 
+
+```python
+# inner
+pd.merge(df1_left, df2_right, on='이름', how='inner')
+```
+```python
+# outer
+pd.merge(df1_left, df2_right, on ="이름", how="outer")
+>>>>>>> Stashed changes
 ```