λΉ λ°μ΄ν°μ νμ
ν¬λ‘μ€ μ§κ³(ν¬λ‘μ€ ν μ΄λΈ, νΈλμμ ν μ΄λΈ)
ν¬λ‘μ€ μ§κ³λ₯Ό μκΈ° μ , ν¬λ‘μ€ ν μ΄λΈμ΄λΌλ κ²μ μμμΌ νλ€.
ν¬λ‘μ€ ν μ΄λΈμ νκ³Ό μ΄μ΄ κ΅μ°¨νλ λΆλΆμ μ«μ λ°μ΄ν°κ° λ€μ΄κ°λ ν μ΄λΈμ λ§νλ€.
μ΄λ μ¬λλ€μ΄ 보기μλ νΈνλ, μ΄μ λ리λ κ²μ κ°λ¨νμ§ μμ λ°μ΄ν°λ² μ΄μ€μμλ λ€λ£¨μ§ μλλ€.
νΈλμμ ν μ΄λΈμ΄λ, μ΄ λ°©ν₯μΌλ‘ λ°μ΄ν°κ° μ¦κ°νμ§ μκ³ , ν λ°©ν₯μΌλ‘ μ¦κ°νλ ν μ΄λΈμ μλ―Ένλ€.
κ²°κ΅ λ°μ΄ν°λ ν¬λ‘μ€ ν μ΄λΈμ΄ μλ νΈλμμ ν μ΄λΈμ ννλ‘ μ μ₯λμ΄μΌ νλ€.
νμ§λ§, λ³΄κ³ μμ κ°μ μκ°ν κ³Όμ μ΄ νμνλ€λ©΄ νΈλμμ ν μ΄λΈ λ³΄λ¨ λ³΄κΈ° μ¬μ΄ ν¬λ‘μ€ ν μ΄λΈμ μ¬μ©ν΄μΌ νλ€.
κ·Έλ κΈ° λλ¬Έμ ν¬λ‘μ€ μ§κ³λΌλ κ²μ μννλ κ²μ΄λ€.
ν¬λ‘μ€ μ§κ³ : νΈλμμ ν μ΄λΈμμ ν¬λ‘μ€ ν μ΄λΈλ‘ λ³κ²½ν΄ μ£Όλ μμ
ν¬λ‘μ€ μ§κ³λ κ΅μ₯ν λ€μν λ°©λ²μΌλ‘ μνν μ μλ€.
1. νΌλ² ν μ΄λΈ κΈ°λ₯μ μν ν¬λ‘μ€ μ§κ³(Excel)
2. BI λꡬμ μν ν¬λ‘μ€ μ§κ³
3. Pandasμ μν ν¬λ‘μ€ μ§κ³
4. SQLμ μν ν μ΄λΈμ μ§κ³
[λ°μ΄ν° μ§κ³ νλ‘μΈμ€]
λ°μ΄ν° λ μ΄ν¬ -> λ°μ΄ν° λ§νΈ -> ν¬λ‘μ€ ν μ΄λΈ/λμ 보λ
λ°μ΄ν° λ§νΈμ ν¬κΈ°μ λ°λΌ μμ€ν μ ꡬμ±μ΄ κ²°μ λκ³ , μκ°ν μ 보λμ λ°μ΄ν° λ§νΈμ ν¬κΈ°μ Trade Off κ΄κ³μ΄λ€.
μ΄ μ§ν₯ μ€ν 리μ§μ μν κ³ μν
λ°μ΄ν°λ² μ΄μ€ λ΄μ μλ μλ§μ λ°μ΄ν°λ₯Ό μ§κ³νκ³ μ νλ€.
κ·Έ μμ μλ λ°μ΄ν°μ μμ΄ μ λ€λ©΄ μκ΄ μμΌλ, λ§λ€λ©΄ μ§μ°μ΄ λ°μνκΈ° λλ¬Έμ μ λΉν λ°©μμΌλ‘ λ°μ΄ν°λ₯Ό μμΆν΄μΌ νλ€.
μ¦, 미리 μ§κ³μ μ ν©νλλ‘ λ³νν΄μΌ νλ€.
μ΄μ μμΆκ³Ό λΆμ°μ κ³Όμ μ ν΅ν΄μ μ΄λ¬ν κ³Όμ μ μ΅μ ννλλ° νΉνλ μμΆμ μμ΄μ κ·Έ μ’ λ₯κ° λλλ€.
μ΄ μ§ν₯ λ°μ΄ν° λ² μ΄μ€
μ΄μ§ν₯ λ°μ΄ν° λ² μ΄μ€ : λΆμν μΌλΆ μΉΌλΌλ§ μ§κ³ν μ μλλ‘ μ΄ λ¨μλ‘ λ°μ΄ν°λ₯Ό μ μ₯νλ DB
κ°μ μ΄μ λ°μ΄ν°κ° μ£Όλ μ μ¬ν νΉμ§μ΄ μμ΄ μμΆμ΄ μμν μ μλ€. λν ν μ§ν₯μ λΉν΄ ν¨μ¬ μ μ λμ€ν¬ I/Oλ₯Ό κ°μ Έμ¨λ€.
λνμ μΌλ‘ Teradata(ν λΌλ°μ΄ν°)μ Amazon RedShift λ±μ΄ μ΄ μ§ν₯ λ°μ΄ν° λ² μ΄μ€μ΄λ€.
ν μ§ν₯ λ°μ΄ν° λ² μ΄μ€
νμ§ν₯ λ°μ΄ν° λ² μ΄μ€ : μΌλ°μ DBμ κ΅¬μ‘°λ‘ μΈλ±μ€λ₯Ό λ£μ΄ λ°μ΄ν°λ₯Ό μ μ₯νλ DBμ΄λ€.
MySQLμ΄λ Oracle DBκ° ν μ§ν₯ DBμ ν΄λΉνλ€.
μ΄λ μνλ λ μ½λλ₯Ό μ°ΎκΈ°μ μμ΄ μΈλ±μ€λ₯Ό μ΄μ©νκΈ°μ λ§μ λμ€ν¬ I/Oλ₯Ό λλ°νλ€.
νΉνλ λ°μ΄ν° λΆμμ μμ΄ κ΅³μ΄ μΈλ±μ€λ₯Ό λΆλ¦¬νμ¬ λΆμν νμκ° μμ΄ λ°μ΄ν°μ μμ΄ λ§μ κ²½μ°μλ μ΄μ§ν₯ λ°μ΄ν°λ² μ΄μ€λ₯Ό λ§μ΄ μ¬μ©νλ€.
MPP λ°μ΄ν°λ² μ΄μ€
λ°μ΄ν°λ₯Ό λΉ λ₯΄κ² μ²λ¦¬νκΈ° μν΄ λ°μ΄ν°λ₯Ό μμΆνκ³ , μ¬λ¬ λμ€ν¬μ λΆμ° μ²λ¦¬λ₯Ό ν λ°μ΄ν°λ² μ΄μ€μ΄λ€.
μ΄λ₯Ό ν΅ν΄ λ°μ΄ν°λ₯Ό λ‘λν λ λΉ λ₯΄λ©°, μ§κ³μλ μ΅μ ν λμ΄ μλ€.
κ·Έλμ λ°μ΄ν°μ μμ΄ λ§λ€λ©΄ MPP λ°μ΄ν° λ² μ΄μ€λ‘ λ°μ΄ν° λ§νΈλ₯Ό μ€κ³νκΈ°λ νλ€.
MPP λ°μ΄ν°λ² μ΄μ€ + μ΄μ§ν₯ λ°μ΄ν°λ² μ΄μ€
μμΆκ³Ό λΆμ°μ²λ¦¬κ° κ°λ₯ν MPP λ°μ΄ν°λ² μ΄μ€μ μ΄μ§ν₯μ κ°λ μ λμ νλ€λ©΄ μ λ§ λΉ¨λΌμ§λ€.
λ€λ§, λλμ λ°μ΄ν°λ₯Ό λμ€ν¬μμ μ½κΈ° λλ¬Έμ 1μ°¨λ‘λΉ μΏΌλ¦¬ μκ°μ΄ κΈΈλ€.
κ·Έλμ 리μμ€ μ ν λ±μ ν΅ν΄ MPP λ°μ΄ν° λ² μ΄μ€λ₯Ό μμ νλ€.
λ°μ΄ν° λ§νΈμ κΈ°λ³Έ ꡬ쑰
νΈλμμ : μκ°κ³Ό ν¨κ» μμ±λλ λ°μ΄ν°
λ§μ€ν° : νΈλμμ μμ μ°Έκ³ λλ κ°μ’ μ 보
ν©νΈ ν μ΄λΈ : νΈλμμ μ²λΌ μ¬μ€μ΄ κΈ°λ‘λ ν μ΄λΈ
λ맨μ ν μ΄λΈ : λ§μ€ν° λ°μ΄ν°λ€
μ€ν μ€ν€λ§ : ν©νΈ ν μ΄λΈμ μ€μ¬μΌλ‘ μ¬λ¬ λλ©μ ν μ΄λΈμ κ²°ν©ν ꡬ쑰
λΉμ κ·ν : μ κ·νμ λ°λλλ μμ
μ€ν μ€ν€λ§ μ€κ³κ° νμν μ΄μ
ν©νΈ ν μ΄λΈμ μ€μκ°μΌλ‘ μμ΄λ λ°μ΄ν°λΌ μκ°μ΄ κ° μλ‘ λ§μμ§λ€. κ·Έλμ λλ§¨μ Ό ν μ΄λΈμ μ΅λν λλ¦¬κ³ , ν©νΈ ν μ΄λΈμ μ¬μ΄μ¦λ₯Ό μ€μ¬ λμ€ν¬ I/Oλ₯Ό μ€μ΄λ λ°©μμΌλ‘ κ°μΌ νλ€.
μμ¦μ λ°μ΄ν° μ¨μ΄νμ°μ€λ₯Ό μ€κ³ν λ, μ€ν μ€ν€λ§ νμμ νμ©νμ¬ μ¨μ΄νμ°μ€λ₯Ό μ€κ³νκ³ λ§νΈλ₯Ό λ§λ€ λλ μ΄λ₯Ό κ²°ν©ν΄ λΉμ κ·ν ν μ΄λΈμ λ§λλ κ²μ΄ μΌλ°μ μ΄λΌκ³ νλ€.
λ§μ½ μ ν΅μ μΈ RDBλ₯Ό λ°μ΄ν° λ§νΈλ‘ μ¬μ©νλ€λ©΄ 쿼리μ§μ°μ΄ λ§μ΄ λ°μν μ μλ€.
κ·Έλμ μ κ·νλ RDB λμ μ, λΉμ κ·ν λ°μ΄ν°λ² μ΄μ€λ₯Ό μ¬μ©νκ³ , BI λꡬλ₯Ό ν΅ν΄ ν¬λ‘μ€ μ§κ³λ₯Ό μννλ€.
ν μ΄λΈ λΉμ κ·ν
λΉμ κ·νλ νλ μ΄μμ ν μ΄λΈμ λ°μ΄ν°λ₯Ό μ€λ³΅νλ©° λ°°μΉνλ μ΅μ ν κΈ°λ²μ΄λ€.
μ΄λ μμ€ν μμ μ±λ₯κ³Ό κ°λ°, μ΄μ νΈμμ±μ μν΄ μ κ·ν λ λ°μ΄ν° λͺ¨λΈμ μλμ μΌλ‘ ν΅ν©, μ€λ³΅, λΆλ¦¬νλ κ³Όμ μ΄λΌκ³ νλ€.
- λ°μ΄ν°κ° μμ²λ§ λ μ½λλΌλ©΄, μ€ν μ€ν€λ§ λ°μ΄ν° μ μ λΉμ κ·ν νμ¬ RDBμ μ£λλ€.
- λ°μ΄ν°κ° μμ΅ λ μ½λλΌλ©΄, μΉΌλΌ λ¨μλ‘ μ΄ μ§ν₯ μ€ν λ¦¬μ§ νμμΌλ‘ λ°μ΄ν°λ₯Ό μ μ₯ν΄μ€λ€.
μ΄ μ§ν₯ μ€ν λ¦¬μ§ λ°©μμ μ¬μ©νλ€λ©΄, μ무리 μΉΌλΌ μκ° λμ΄λ μ±λ₯μ μν₯μ μ£Όμ§ μλλ€.
μ¦, ν©νΈ ν μ΄λΈμ λͺ¨λ μΉΌλΌμ λ£λ μ΄ μ§ν₯μΌλ‘ μμΆ/λΆμ°μ νμ¬ λμ€ν¬ I/Oμ μ¦κ°λ₯Ό μ΅μ νλ κ²μ΄λ€.
μ΄ν, λ€μ°¨μ λͺ¨λΈμ΄λΌλ μΈ‘μ κ°κ³Ό μ΄λ₯Ό μ€λͺ νλ λλ©μ Ό ν μ΄λΈ(νΌλ² ν μ΄λΈκ³Ό μ μ¬) ꡬμ±μΌλ‘ μκ°νλ₯Ό μνν μ μλ€.
Reference
02. λΉ λ°μ΄ν°μ νμ
⬠첫 λ²μ§Έ ν¬μ€ν λ§ν¬ 01. λΉ λ°μ΄ν°μ κΈ°μ΄ μ§μ λλ λ°μ΄ν°μμ§λμ΄λ₯Ό ν¬λ§νλ€. λ°μ΄ν°μμ§λμ΄κ° λͺΉ!μ! λκ³ μΆμ μ¬λμΌλ‘μ, 'λΉ λ°μ΄ν°λ₯Ό μ§ν±νλ κΈ°μ 'μ μμ°¨λ‘ μ½μλ κ² κ°λ€. λ¨Έλ¦Ώ
eng-sohee.tistory.com
- λΉ λ°μ΄ν°λ₯Ό μ§ν±νλ κΈ°μ - λμλ€ μΌμ΄μ€μΌ
'π Data Engineering > κ΄λ ¨λ μ§μ' μΉ΄ν κ³ λ¦¬μ λ€λ₯Έ κΈ
[μ± μ 리] λΉ λ°μ΄ν°λ₯Ό μ§ν±νλ κΈ°μ - λΉ λ°μ΄ν°μ κΈ°μ΄ (2) | 2023.09.16 |
---|