파이널리

minju0611 · minju0611 · commit 29145b79d1e8 · 2025-02-06T17:45:09.000+09:00
diff --git a/_posts/2025-02-03-헷갈리는 것들.md b/_posts/2025-02-03-헷갈리는 것들.md
@@ -23,14 +23,18 @@ LIst comprehension
 
 # My SQL
  
- SELECT
+ ### SELECT
  - ISNULL
  - IFNULL
  - IF
  - CASE WHEN THEN (여러개의 조건식)
  - DISTINCT (중복된 데이터 제거)
 
-WHERE
+#### UNION
+- 여러 개의 `SELECT` 결과를 `세로`로 합치는 연산자
+    - 각 `SELECT` 문이 하나의 행(row)이 되고, `UNION`이 그것들을 하나의 집합으로 합침.
+
+### WHERE
 - = , !=, >, <, >=, <=
 - LIKE / NOT LIKE
   - % (와일드카드)
@@ -39,14 +43,33 @@ WHERE
 - AND / OR
 - BETWEEN / NOT BETWEEN
 
-ORDER BY
+### ORDER BY
 - ASC
 - DESC
 
-LIMIT
+### LIMIT
 - LIMIT(4,10) (데이터를 5번째부터 10개)
 
 VARCHAR : 가변적인 문자열 데이터
 CHAR : 고정된 문자열 데이터
 
-DECIMAL(5,2) : 999.99가 최대 크기인 고정된 자릿수의 소수 표현
+### DECIMAL
+- DECIMAL(5,2) : 999.99가 최대 크기인 고정된 자릿수의 소수 표현
+
+### GROUP BY
+group by를 했을 경우 - 내가 집계 하고자 하는 대상과 group의 이름 빼고는 select절에서 사용할 수 없다. 
+
+WHERE : FROM에서 불러온 데이터에 대한 필터링
+HAVING : 집계 결과에 대한 필터링
+  - 무조건 GROUP BY와 함께 사용해야 함.
+
+### WINDOW FUNCTION
+GROUP BY - 집계를 하면 Reduction 발생함.
+Window Functions - 집계를 해도 Reduction이 발생하지 않음.
+
+One TO Many
+참조키 왜래키
+CROSS JOIN
+
+count * : 행의 개수 셈
+
diff --git a/_posts/2025-02-05-sql실습01.md b/_posts/2025-02-05-sql실습01.md
@@ -3,9 +3,9 @@ layout : post
 title : "Mysql 실습 01"
 
 categories:
-  - learning log
+  - sql
 tags:
-  - [memo]
+  - [sql, mysql]
 
 toc: true
 toc_sticky: true
diff --git a/_posts/2025-02-06-학습로그1(stack,melt).md b/_posts/2025-02-06-학습로그1(stack,melt).md
@@ -13,13 +13,13 @@ toc_sticky: true
 date: 2025-02-06 12:52:00 +0900
 ---
 
-## 서론
+# 서론
  &nbsp;`학습로그`를 처음 작성하기에 앞서, 내가 수업시간에 헷갈리던 부분이 무엇인가 작성한 코랩 파일을 하나씩 보며 되짚어봤다.
 여러가지가 있었지만... 그 중에서도 잘 이해가 되지 않았던 `stack`과 `melt`가 눈에 들어왔다. 
 중요한 집계 파트이기도 했고, melt가 중요하다고 말씀하신 거 같았기에, 이번 기회에 확실히 개념을 잡고 넘어가면 좋을 거 같았다.
 `stack`과 `melt`의 용도를 헷갈리기 전에, `집계`란 무엇인지 정확히 알고 가자. 
 
-## 본론
+# 본론
 #### **집계란?**
  &nbsp;여러 개의 값을 모아(**'집'**) 계산하여(**'계'**) <u>하나의 값으로 요약</u>하는 과정이다.
 대표적인 집계 함수로는 mean(), min(), max() 등이 있다.
@@ -67,8 +67,7 @@ Index(['이름', '반', '국어', '수학', '영어'], dtype='object')
 ***
 
 해당 df를 사용하여 `stack`, `melt`에 대해 자세히 이해해보자.
-`stack`과 `melt`를 이해하기에 앞서, 보통의 DataFrame 컬럼은 `멀티인덱스`를 갖지 
-않지 않는다. 따라서 `pivot_table`을 통해 집계를 시행하여 컬럼에 `멀티인덱스`를 만든 뒤에, `stack`과 `melt`를 적용해보자.
+`stack`과 `melt`를 이해하기에 앞서, 보통의 DataFrame 컬럼은 `멀티인덱스`를 갖지 않는다. 따라서 `pivot_table`을 통해 집계를 시행하여 컬럼에 `멀티인덱스`를 만든 뒤에, `stack`과 `melt`를 적용해보자.
 
 ## pivot_table
 - 컬럼에 있는 것들을 직접 index, columns, values,으로 지정하고, 원하는 집계 방법을 aggfunc에 적는다.
@@ -127,8 +126,8 @@ MultiIndex([('mean', '국어'),
             ( 'max', '영어')],
            )
 ```
-이렇게 표의 출력과 index와 columns를 확인을 통해 컬럼이 멀티인덱스로 변경됨을 확인할 수 있다.
-이 상태에서 stack을 사용한다면 어떤 변화가 일어날까? 
+이렇게 표의 출력과 index와 columns를 확인을 통해 컬럼이 `멀티인덱스`로 변경됨을 확인할 수 있다.
+이 상태에서 `stack`을 사용한다면 어떤 변화가 일어날까? 
 
 스택의 특징은 다음과 같다. 
 ## stack
@@ -137,7 +136,7 @@ MultiIndex([('mean', '국어'),
   - 행 인덱스는 `MultiIndex`가 됨
   - 표가 가로로 너무 길 경우(wide format), 세로로 길게 만들 수 있음(long format)
 - **집계를 하기 위한 기능은 아니다!**
-    - `멀티인덱스`는 **집계가 불가능**하다.
+    - `멀티인덱스`는 **집계가 불가능**하기 때문.
 - stack() 안에 컬럼 레벨을 지정하지 않으면 가장 하위레벨이 자동으로 선택 된다.
 - 결과적으로, 기존 표의 구조를 바꿔서 보기 쉽게 만든다.
 
@@ -195,11 +194,16 @@ Index(['mean', 'min', 'max'], dtype='object')
 ***
 
 또한 stack의 반대 개념인 `unstack`이 존재하는데, stack의 반대 개념이므로 가볍게 보고 넘어가자.
-### unstack()
+## unstack()
 - 행의 `멀티인덱스`를 컬럼으로 올린다.
   - stack()의 반대개념이다.
 - stack()을 실행한 DataFrame을 unstack하면 처음 형태가 된다.
 
+```
+stack : 컬럼 -> 행
+unstack : 행 -> 컬럼
+```
+
 #### unstack() 사용법
 ```python
 df.unstack(행 인덱스 레벨)
@@ -210,11 +214,11 @@ df_stack.unstack()
 ```
 `[출력]`   
 ![](/images/../images/2025-02-05-23-18-42.png)
-- 행 인덱스의 가장 하위레벨이었던 `'국어', '수학', '영어'`가 컬럼인덱스의 가장 하위레벨이 되었다.
+- 행 인덱스의 가장 하위레벨이었던 `'국어', '수학', '영어'`가 컬럼인덱스의 가장 `하위레벨`이 되었다.
 
 ***
 
-위의 과정을 통해, `stack`은 **컬럼레벨을 행의 인덱스** 만드는 것을 알게 되었다. 또한 stack을 통해 컬럼을 행 인덱스로
+위의 과정을 통해, `stack`은 **컬럼레벨을 행의 인덱스**로 만드는 것을 알게 되었다. 또한 `stack`을 통해 컬럼을 행 인덱스로
 내리면, 인덱스가 합쳐져 `멀티인덱스`가 됨을 알았다.
 
 컬럼이 `멀티인덱스`인 경우 가로로 표가 길어져 가독성이 떨어지기 때문에 `stack`을 통해 표의 구조를 보기 좋게 바꿀 수 있다.
@@ -225,8 +229,8 @@ df_stack.unstack()
  
 ## melt
 
-- 기준을 잡은 컬럼들을 제외하고, 남은 컬럼들을 하나의 컬럼으로 녹임.
-    - 따라서 카테고리가 컬럼에 있다면, 해당 카테고리에 대해 집계를 할 수 있게 해준다.
+- 기준을 잡은 컬럼들을 제외하고, 남은 **컬럼들을 하나의 컬럼으로** 녹임.
+    - 따라서 카테고리가 컬럼에 있다면, 해당 카테고리에 대해 **집계를 할 수 있게 해준다.**
 
 특징을 살펴보면 `stack`과의 차이를 볼 수 있다. `stack`은 **컬럼을 행인덱스로 만드는 것**이고, `melt`는 컬럼들을 기준을 두고 **하나의 컬럼으로 녹이는 것**이다.
 뭔가 알쏭달쏭 알 것 같지만, 아직 헷갈리기 때문에 직접 사용해서 비교해보자.  
@@ -298,7 +302,7 @@ Index(['이름', '반', '과목', '점수'], dtype='object')
 | 사용 예시 | `df.stack()` | `pd.melt(df, id_vars=["기준 컬럼"])` |
 | 주로 사용하는 상황 | 멀티인덱스가 필요할 때 | 데이터 시각화를 위해 긴 형태(long format)로 변환할 때 |
 
-## 마무리
+# 마무리
   &nbsp; 학습로그를 태어나서 처음 작성해 보았는데, 내가 모르는 부분을 시간내서 조사하고,
  이해하는 게 생각보다 재밌어서 좋았다. 그러나 조사하고 공부한 내용들을 머릿속에서 꺼내서
  예쁘게 작성하는 게 어려웠다. 아직 요령이 없어서 그렇다고 생각한다. 앞으로 꾸준히 작성해서