[GP] R νλ‘κ·Έλλ°κ³Ό λ°μ΄ν°-μ²λ¦¬
μ΄ κΈμ N.K Dev Labμμ μμ±λ κΈμ
λλ€.
μλ νμΈμ. μ λͺ κ°μ κ° μ λΈλ‘κ·Έμ ν¬μ€ν μ΄ μμμ£ ?.. μμ¦ λ°μ΄ν°μ μ¨λ¦νλλΌκ³ μ μ μ΄ μμμ΅λλ€. μ΄μ νλ‘κ·Έλλ°μ λμ΄μ λ°μ΄ν°μ λν μμ μ μ‘°κΈμ© λ°°μλκ°κ³ μμ΅λλ€λ§ SQL λͺ¨λΈλ§μ μ‘°κΈ ν΄λ΄€μΌλ©΄μλ κ°μ₯ κΈ°μ΄μ μΈ λ°μ΄ν°μ²λ¦¬ λ±μ μν΄λ¬μ μμ μ νλ λ΄λ΄ μκ°νλ κ²μ κ΅κ°μμ μ 곡νλ 컀리νλΌμ μ‘°κΈ μ΅νλ³ΌκΉ λΌλ μκ°λ λ§μ΄ νκ³€ ν©λλ€.
μ λ μκ·Ό My-way μ€νμΌμ΄λ©΄μλ κ°λμ©μ μ΄κ² λ§λ μΆμ κ³ λ―Όμ΄ μκΈΈ λλ κ°μ΄λλΌμΈμ νκ³€ ν©λλ€. νμ§λ§ κ·Έ κ°μ΄λλΌμΈμ 보면μλ βλΉν¨μ¨μ μ΄λ€β, βλ΄ μ€νμΌμ μλλ€.β, βλ κΉλνκ²βλΌλ μμ¬μ κ°μ§κ² λλλ°, κ·Έλ¬λ€λ³΄λ©΄ νμ°Έμ κ³ λ―Όνλ€κ°λ μ§λ μ§νμ΄ λμ§ μμμ μμ¦μλ μ§λ€κ°λ λ΄ μ€νμΌ μλ μ½λμ λν΄μλ μΌλ¨ λ°©μΉν΄λμλ€κ° μ‘°κΈ μκ°μ μΈ μ¬μ κ° μμ λ λ€μκΈ κ·Έ μ€νμΌμ λ°κΏμ μ½λ©νλ κ²μ΄ μ μ μ€νμΌμ΄ λλ²λ Έμ΅λλ€.
Data Processing
μννΈμ¨μ΄ κ°λ°μ μ μ₯μμ λ°μ΄ν° μ²λ¦¬β¦ μ¬μ€ DBAμ μ§μ± μ κ°μ§μ λΆλ€μ΄ μ£Όλ‘ νλ μΌμ΄λΌκ³ 보λ κ²μ΄ λ§κ² μ§λ§ μννΈμ¨μ΄ κ°λ°μκ° μ§μ μ μΌλ‘ λ°μ΄ν°μ κ΄μ¬νλ κ²½μ°λ κ·Ήν λλ λλ€. μ¬μ€μ μννΈμ¨μ΄ κ°λ°μλ μ¬μ©μμ μΈ‘λ©΄μ κ³ λ €νκ³ μΌλ§λ νΈνκ³ λ μ’μ κ²°κ³Όλ₯Ό λΌ μ μλλμ λ¬λ € μλ€κ³ μκ°νμ΅λλ€.
νμ§λ§ μ΄λ²μ λ°μ΄ν° μ²λ¦¬λ₯Ό νλ©΄μ μ¬μ€μ μ΄λ κ² λ§κ΅¬μ‘μ΄λ‘ λ§μ΄λν λ°μ΄ν°λ₯Ό μ²λ¦¬νμ¬ μ 보μ μ§μμΌλ‘ λ§λλ λ°λ μ¬λ¬ μκ³ λ¦¬μ¦μ μ¬μ©ν΄μΌ ν©λλ€. λ°λΌμ λ°μ΄ν° μ²λ¦¬μ μννΈμ¨μ΄μ κ°λ°μ λ°λμ λ°λμ μΈ‘λ©΄μ κ°μ§μ§ μλλ€λ κ²μ μκ² λμμ΅λλ€. μννΈμ¨μ΄λ₯Ό κ°λ°νλ λ° μμ΄μλ μ¬μ©μκ° μ΄λ ν μΈνμ μ£Όκ² λλ©΄ κ·Έμ λ°λ₯Έ κ²°κ³Όλ₯Ό μΆλ ₯νλ κ²μ²λΌ λ°μ΄ν°λ₯Ό μ²λ¦¬νλ λ°λ μ΄λ ν λͺ¨μμ§ λ°μ΄ν°λ₯Ό μ 보μ μ§μμΌλ‘ μΆμ νλ λ° μμ΄ μ¬λ¬ μκ³ λ¦¬μ¦μ ꡬννλ κ² λν κ°μ μΌμ λλ€.
ETL
λ°μ΄ν° μ²λ¦¬ μμ μ νλ©΄μ λ£κ² λ λ¨μ΄ μ€ νλκ° λ°λ‘ ETLμ΄λΌλ λ¨μ΄μμ΅λλ€. μ¬μ€ λ°μ΄ν° μμ§λμ΄μ μ λ¬Έν κ²μ μ²μμ΄μκ³ κ·Έ μ€ μ κ° μ κ° μ²μ νλ μμ μ΄ ETLμ΄λΌλ κ²λ μμ μ νλ λμ€ μκ² λμμ΅λλ€. ETLμ Extract(μΆμΆ), Transform(λ³ν), Load(μ μ¬)μ μ½μλ‘ μ¬μ€μ κ·Έλ κ² μ΄λ €μ 보μ΄λ μμ μ μλμ§λ§ μκ·Όν μμ΄ λ§μ΄ κ°κ² λ μμ μ€μ νλμμ΅λλ€.
μ κ° κ°λ¨ν νκ³ μλ μΌμ λ§μλ리μλ©΄, μ λ μ΄λ€ μ΄λ―Έμ§λ₯Ό κ°μ§κ³ ν΄λΉ μ΄λ―Έμ§κ° μ΄λ€ μ΄λ―Έμ§μΈμ§, ν¬κΈ°λ μΌλ§λ λλμ§, λ§μ½ ν¬κΈ°κ° λ€λ₯΄λ€λ©΄ μΌμ ν¬κΈ°μ λ§μΆ° λ³ννλ μμ μ κ±°μ³μΌ νκ³ , κ·Έκ±°μ λ§μΆ°μ λ€μ DBμ μ μ¬νμ¬μΌ ν©λλ€. μ‘°κΈ λ€λ₯Έ μ리λ₯Ό μκ² λ κ²μ μ΄λ―Έμ§ μ²λ¦¬λ₯Ό μν΄μ Not only SQLμ μ¬μ©ν κ²μ΄λΌκ³ μκ°νμ§λ§ κ·Έλ₯ SQLλ§μ κ°μ§κ³ λ μμ μ²λ¦¬κ° μννκ² λμκ° μ μμμ μκ² λμμ΅λλ€.
νμ§λ§ μ΄λ―Έμ§ λ°μ΄ν°μ μΆμΆμ ν½μ λ°μ΄ν°κ° λ μλ μμ΅λλ€. μ΄λ₯Όν λ©΄ OpenCVμ κ°μ μ»΄ν¨ν° λΉμ λΌμ΄λΈλ¬λ¦¬λ₯Ό μ¬μ©ν΄μ ν½μ λ°μ΄ν°λ₯Ό λΆμνκ³ μ΄λ₯Ό ν΅νμ¬ λ°μ΄ν°λ₯Ό μΆμΆνλ λ°©λ²λ μκ² μ§λ§ μμ¦μλ λ©νλ°μ΄ν° νμ±νκ° μ λμ΄μλμ§ μ΄λ¬ν λ©νλ°μ΄ν°λ₯Ό λ§μ΄λνλ κ²λ§μΌλ‘λ μΆ©λΆν μ 보λ₯Ό κΈμ΄μ¬ μκ° μμ΅λλ€. νμ§λ§ κ·Έκ² μμ μ κ° νμν λͺ¨λ μ 보λ₯Ό κ°μ Έμ¬ μ μλ κ²μ μλλλ€. κ·Έλμ PixelDataλ₯Ό μ¬μ©ν΄ νμ€ μ΄λ―Έμ§λ‘ μ μ₯νμ¬ μ΄λ₯Ό λ€μ OpenCVλ‘ μ²λ¦¬νμ¬ DBμ μ μ¬νλ λ°©λ²μ μ°λκ° νλ λ°©λ²λ κ³ λ €ν΄λ³΄κ³ μμ΅λλ€.
μ ννκ²λ μμ κ·λͺ¨μ νλ‘κ·Έλ¨μ νμΌ λ¨μλ‘ λΌμ΄λΈλ¬λ¦¬λ ν¨ν€μ§λ₯Ό μ΄μ©ν΄ κ·Έ λ°μ΄ν°λ€μ κ°λ¨ν κΈμ΄μμ ννν μ μμ§λ§ λ°μ΄ν°μ κ·λͺ¨κ° 컀μ§λ©΄ κ·Έκ² λν νκ³κ° μκΉλλ€. λ νλ‘κ·Έλλ° μΈμ΄μμ μ§μνλ μλ£ κ΅¬μ‘°λ νμ λμ΄ μκ³ λΉ λ°μ΄ν°λ₯Ό μ²λ¦¬νκΈ° μν΄ Data Structure λν μ ν΄μ Έ μμ΅λλ€. μ΄μ μ΅μ ν λ μΈμ΄λ Pythonκ³Ό R μΈμ΄μκ³ μ λ μ΄λ¬ν λ°μ΄ν° μ²λ¦¬λ₯Ό μν΄ R μ 곡λΆνμ¬μΌ νμ΅λλ€.
R
μ κ° μ²μ λ³Έ R μΈμ΄λ Pythonκ³Ό μ μ¬ν μΈμ΄μμ΅λλ€. λ³μ νμ
μ μ§μ νμ§ μκ³ μμ λ‘κ² μ¬μ©ν μ μλ μ€ν¬λ¦½νΈ ννμ μΈμ΄, νμ§λ§ μ μκ² μ΅μν΄μ§λ λ° λ무λ λ§μ μκ°μ λ€μ¬μΌ νμ΅λλ€. λ¨μν μλ£ν νμ
μ μ§μ νμ§ μλ λ¬Έμ λλ¬Έμ΄ μλλΌ μ¬λ¬κ°μ§ λ¬Έλ²μ΄ μ‘΄μ¬νμκ³ , νμμ μμ£Ό μ¬μ©νλ OOPμ κ°μ νλ‘κ·Έλλ°μ μ μ°Ύμλ³Ό μ μμμΌλ©° λͺ¨λνλ λ μ΄λ»κ² ν΄μΌνλμ§λ₯Ό μ λͺ°λΌ μ΄λ€ λ°©μμΌλ‘ μ κ·Όν΄μΌνλμ§λ μ΅μνμ§ μμμ΅λλ€.
μ΄μ΄μ μ½μΌμλ €λ©΄ μλμ λ²νΌμ ν΄λ¦ν΄μ£ΌμΈμ.
'Data Analysis > R' μΉ΄ν κ³ λ¦¬μ λ€λ₯Έ κΈ
[GP] Rμμ μ½λλ₯Ό λ³λ ¬μ²λ¦¬ νλ λ°©λ² (0) | 2019.02.10 |
---|---|
[GP] Rμμ λ°μ΄ν°λ² μ΄μ€(RDBMS)μ μ°κ²°νλ 3κ°μ§ λ°©λ² (0) | 2018.12.31 |
[GP] Rμ λ€μν μλ£κ΅¬μ‘°λ€ (0) | 2018.08.26 |