πŸ“– μŠ€ν† λ¦¬μ§€ 기초

제 1μž₯. 데이터 μŠ€ν† λ¦¬μ§€μ˜ μ€‘μš”μ„±

μ˜€λŠ˜λ‚  λͺ¨λ“  μ• ν”Œλ¦¬μΌ€μ΄μ…˜μ€ 데이터에 μ˜μ‘΄ν•˜κ³  있으며, 데이터가 μ—†μœΌλ©΄ ꡬ글 λ§΅, νƒμ‹œ μ˜ˆμ•½, 온라인 λ±…ν‚Ήκ³Ό 같은 ν•„μˆ˜ μ„œλΉ„μŠ€λ₯Ό μ΄μš©ν•  수 μ—†μŠ΅λ‹ˆλ‹€. 쑰직은 λΉ„μ¦ˆλ‹ˆμŠ€ μ„±μž₯κ³Ό 데이터 보호λ₯Ό μœ„ν•΄ 데이터λ₯Ό λ””μ§€ν„Έ ν˜•νƒœλ‘œ μ €μž₯ν•΄μ•Ό ν•©λ‹ˆλ‹€. 데이터λ₯Ό μ €μž₯ν•˜λŠ” μ£Όμš” 이유 쀑 ν•˜λ‚˜λŠ” κΈ°λ³Έ 데이터가 λ°”μ΄λŸ¬μŠ€λ‚˜ λžœμ„¬μ›¨μ–΄ 곡격으둜 μ†μƒλ˜μ—ˆμ„ λ•Œ 백업본을 톡해 λ³΅μ›ν•˜κΈ° μœ„ν•¨μž…λ‹ˆλ‹€.


제 2μž₯. λ””μ§€ν„Έ λ°μ΄ν„°μ˜ 3κ°€μ§€ μ£Όμš” μœ ν˜•

λ°μ΄ν„°λŠ” μ‚¬μš© 방식과 ν˜•νƒœμ— 따라 크게 μ„Έ κ°€μ§€λ‘œ λΆ„λ₯˜λ©λ‹ˆλ‹€.

  • λΉ„μ •ν˜• 데이터 (Unstructured Data): PDF, 이미지, λΉ„λ””μ˜€ λ¬Έμ„œ λ“± λ¬΄μž‘μœ„ μ‚¬μš©μžμ— μ˜ν•΄ μƒμ„±λ˜κ³  쀑앙에 μ €μž₯λ˜λŠ” ν˜•νƒœμ˜ λ°μ΄ν„°μž…λ‹ˆλ‹€.
  • λ°˜μ •ν˜• 데이터 (Semi-structured Data): μ—‘μ…€(Excel)κ³Ό 같은 μŠ€ν”„λ ˆλ“œμ‹œνŠΈλ‚˜ XML 파일 ν˜•νƒœλ‘œ μ €μž₯λ˜λŠ” λ°μ΄ν„°μž…λ‹ˆλ‹€. 데이터λ₯Ό ν–‰κ³Ό μ—΄λ‘œ κ΅¬μ„±ν•˜μ—¬ μ‰½κ²Œ μ΄ν•΄ν•˜κ³  탐색할 수 μžˆμŠ΅λ‹ˆλ‹€.
  • μ •ν˜• 데이터 (Structured Data): SQL, Oracle, MongoDB와 같은 λ°μ΄ν„°λ² μ΄μŠ€μ— μ €μž₯λ˜λŠ” λ°μ΄ν„°μž…λ‹ˆλ‹€. μ‹ μ†ν•œ 검색과 μ‘°νšŒκ°€ κ°€λŠ₯ν•˜λ©° 보닀 μ•ˆμ •μ μ΄κ³  λΉ λ₯Έ λ°©μ‹μœΌλ‘œ 데이터λ₯Ό κ°€μ Έμ˜¬ 수 μžˆμŠ΅λ‹ˆλ‹€.

제 3μž₯. μŠ€ν† λ¦¬μ§€ λ””λ°”μ΄μŠ€ 및 데이터 μ„Όν„°

데이터λ₯Ό μ•ˆμ „ν•˜κ²Œ κ΄€λ¦¬ν•˜κΈ° μœ„ν•΄μ„œλŠ” μ‹ λ’°μ„± 높은 μŠ€ν† λ¦¬μ§€ μž₯비와 이λ₯Ό μš΄μ˜ν•˜λŠ” 데이터 μ„Όν„°κ°€ ν•„μš”ν•©λ‹ˆλ‹€.

1. μ£Όμš” μŠ€ν† λ¦¬μ§€ λ””λ°”μ΄μŠ€

μŠ€ν† λ¦¬μ§€ λ””λ°”μ΄μŠ€λŠ” λ””μ§€ν„Έ ν˜•νƒœλ‘œ 데이터λ₯Ό μ €μž₯ν•  수 μžˆλŠ” κΈ°κΈ°λ₯Ό μ˜λ―Έν•©λ‹ˆλ‹€.

  • ν•˜λ“œ λ””μŠ€ν¬ λ“œλΌμ΄λΈŒ (HDD): λž©ν†±, λ°μŠ€ν¬ν†±, μ„œλ²„μ—μ„œ λ‚΄λΆ€ μŠ€ν† λ¦¬μ§€λ‘œ 널리 μ‚¬μš©λ©λ‹ˆλ‹€.
  • λ°±μ—…μš© μŠ€ν† λ¦¬μ§€: 1μ°¨ 데이터 손상 μ‹œ λ³΅μ›ν•˜κΈ° μœ„ν•œ 2μ°¨ μŠ€ν† λ¦¬μ§€λ‘œ λ§ˆκ·Έλ„€ν‹± ν…Œμ΄ν”„ λ“œλΌμ΄λΈŒλ‚˜ κ΄‘ν•™ μŠ€ν† λ¦¬μ§€(Blu-ray, DVD, CD-ROM)κ°€ μ‚¬μš©λ©λ‹ˆλ‹€.
  • νœ΄λŒ€μš© μŠ€ν† λ¦¬μ§€: 펜 λ“œλΌμ΄λΈŒ(ν”Œλž˜μ‹œ λ“œλΌμ΄λΈŒ)λ‚˜ λͺ¨λ°”μΌμ—μ„œ 주둜 μ“°μ΄λŠ” SD μΉ΄λ“œ 등이 μžˆμœΌλ‚˜ μš©λŸ‰μ΄ μž‘μŠ΅λ‹ˆλ‹€.
  • μ†”λ¦¬λ“œ μŠ€ν…Œμ΄νŠΈ λ“œλΌμ΄λΈŒ (SSD): 더 λ§Žμ€ μ–‘μ˜ 데이터λ₯Ό 더 λΉ λ₯΄κ²Œ 읽고 μ“°κΈ° μœ„ν•΄ μ‘°μ§μ—μ„œ μ„ ν˜Έν•˜λŠ” μž₯μΉ˜μž…λ‹ˆλ‹€.
2. 데이터 μ„Όν„° (Data Center)

데이터 μ„Όν„°λŠ” 기업이 IT 인프라λ₯Ό μ‹€ν–‰, λͺ¨λ‹ˆν„°λ§, κ΄€λ¦¬ν•˜κΈ° μœ„ν•΄ κ΅¬μΆ•ν•œ μ‹œμ„€μž…λ‹ˆλ‹€.

  • ν•˜λ“œμ›¨μ–΄ ꡬ성 μš”μ†Œ: μ„œλ²„, λ„€νŠΈμ›Œν¬, μŠ€ν† λ¦¬μ§€.
  • μ†Œν”„νŠΈμ›¨μ–΄ ꡬ성 μš”μ†Œ: 운영 체제(Windows, Linux λ“±), μ• ν”Œλ¦¬μΌ€μ΄μ…˜, λ°μ΄ν„°λ² μ΄μŠ€.
  • 졜근 쑰직듀은 물리적 데이터 μ„Όν„°λ₯Ό 직접 κ΅¬μΆ•ν•˜κΈ°λ³΄λ‹€ λΉ„μš© 효율적인 ν΄λΌμš°λ“œλ‘œ μ „ν™˜ν•˜λŠ” μΆ”μ„Έμž…λ‹ˆλ‹€.

제 4μž₯. μŠ€ν† λ¦¬μ§€ μˆ˜μš”λ₯Ό μ£Όλ„ν•˜λŠ” 4λŒ€ 핡심 기술

λ””μ§€ν„Έ νŠΈλžœμŠ€ν¬λ©”μ΄μ…˜ μ‹œλŒ€μ— μ ‘μ–΄λ“€λ©΄μ„œ, μ•„λž˜ 4κ°€μ§€ 기술이 μŠ€ν† λ¦¬μ§€ λΆ„μ•Όμ˜ μ€‘μš”μ„±μ„ λ”μš± ν‚€μš°κ³  μžˆμŠ΅λ‹ˆλ‹€.

  1. ν΄λΌμš°λ“œ (Cloud): 자체 데이터 μ„Όν„°λ₯Ό κ΅¬μΆ•ν•˜λŠ” λŒ€μ‹  ν΄λΌμš°λ“œλ₯Ό 톡해 더 λ§Žμ€ 데이터λ₯Ό 효율적이고 λΉ„μš© 효과적으둜 κ΄€λ¦¬ν•©λ‹ˆλ‹€.
  2. 빅데이터 뢄석 (Big Data Analytics): λΉ„μ¦ˆλ‹ˆμŠ€ μ„±μž₯ μ „λž΅, λ§ˆμΌ€νŒ… 캠페인 κ³„νš, 고객 μ„œλΉ„μŠ€ κ°œμ„ μ„ μœ„ν•΄ λ°©λŒ€ν•œ 데이터λ₯Ό λΆ„μ„ν•˜λ©°, 이λ₯Ό μœ„ν•΄ 더 큰 μ €μž₯ 곡간이 ν•„μš”ν•©λ‹ˆλ‹€.
  3. 사물 인터넷 (IoT): 슀마트폰 μ•±μœΌλ‘œ κ°€μ •μ˜ Wi-Fi 에어컨을 μ œμ–΄ν•˜λŠ” κ²ƒμ²˜λŸΌ, μ—¬λŸ¬ κΈ°κΈ°λ₯Ό 단일 μ ‘μ μ—μ„œ μ—°κ²°ν•˜κ³  κ΄€λ¦¬ν•©λ‹ˆλ‹€.
  4. λ¨Έμ‹  λŸ¬λ‹ (Machine Learning): μ• ν”Œλ¦¬μΌ€μ΄μ…˜μ΄ κ³Όκ±° 데이터λ₯Ό 기반으둜 μ§€λŠ₯ν™”λ˜μ–΄ μΆ”μ²œ, μ•Œλ¦Ό, μ˜μ‚¬ κ²°μ • λ“± ν•„μš”ν•œ 쑰치λ₯Ό μ·¨ν•  수 μžˆλ„λ‘ λ•μŠ΅λ‹ˆλ‹€.

제 5μž₯. ν΄λΌμš°λ“œ μ»΄ν“¨νŒ… μ™„μ „ 정볡

1. ν΄λΌμš°λ“œμ˜ μ£Όμš” νŠΉμ§•
  • μ„œλΉ„μŠ€ μΈ‘μ • κ°€λŠ₯: μ‚¬μš©ν•œ μ„œλΉ„μŠ€μ˜ μ–‘κ³Ό λΉ„μš©μ„ λͺ…ν™•ν•˜κ²Œ νŒŒμ•…ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
  • λ¦¬μ†ŒμŠ€ 풀링 (Resource Pooling): μ „μš© ν•˜λ“œμ›¨μ–΄κ°€ μ•„λ‹Œ λ¦¬μ†ŒμŠ€ ν’€μ—μ„œ 곡유된 ν•˜λ“œμ›¨μ–΄λ₯Ό μ‚¬μš©ν•˜μ—¬ μ‚¬μš©ν•œ 사양에 λŒ€ν•΄μ„œλ§Œ λΉ„μš©μ„ μ§€λΆˆν•©λ‹ˆλ‹€.
  • 탄λ ₯μ„± 및 μ˜¨λ””λ§¨λ“œ μ…€ν”„ μ„œλΉ„μŠ€: μ• ν”Œλ¦¬μΌ€μ΄μ…˜ μˆ˜μš”μ— 따라 ν•˜λ“œμ›¨μ–΄ 사양을 μ¦‰μ‹œ ν™•μž₯ν•˜μ—¬ μ„±λŠ₯을 높일 수 μžˆμŠ΅λ‹ˆλ‹€.
  • κ΄‘λ²”μœ„ν•œ λ„€νŠΈμ›Œν¬ μ•‘μ„ΈμŠ€: μ£Όμš” ν΄λΌμš°λ“œ 제곡자(AWS, Azure, GCP)λŠ” μ „ 세계에 데이터 μ„Όν„°λ₯Ό λ³΄μœ ν•˜μ—¬ 높은 λŒ€μ—­ν­κ³Ό κ³ κ°€μš©μ„±μ„ μ œκ³΅ν•©λ‹ˆλ‹€.
2. ν΄λΌμš°λ“œ μ„œλΉ„μŠ€ λͺ¨λΈ

μ–΄λ–€ μ˜μ—­κΉŒμ§€ ν΄λΌμš°λ“œ μ œκ³΅μžμ—κ²Œ λ§‘κΈΈ 것인지에 따라 3κ°€μ§€λ‘œ λ‚˜λ‰©λ‹ˆλ‹€.

  • IaaS (μΈν”„λΌμŠ€νŠΈλŸ­μ²˜ μ„œλΉ„μŠ€): μ»΄ν“¨νŒ…, μŠ€ν† λ¦¬μ§€, λ„€νŠΈμ›Œν¬ ν•˜λ“œμ›¨μ–΄λ₯Ό μ œκ³΅λ°›μœΌλ©°, 운영 체제 및 μ• ν”Œλ¦¬μΌ€μ΄μ…˜ κ΄€λ¦¬λŠ” 직접 ν•΄μ•Ό ν•©λ‹ˆλ‹€ (예: Amazon, Google Compute Engine).
  • PaaS (ν”Œλž«νΌ μ„œλΉ„μŠ€): ν•˜λ“œμ›¨μ–΄, 운영 체제, ν”„λ‘œκ·Έλž˜λ° ν”„λ ˆμž„μ›Œν¬, λ°μ΄ν„°λ² μ΄μŠ€κΉŒμ§€ μ œκ³΅λ°›μ•„ μ‚¬μš©μžλŠ” μžμ‹ μ˜ μ• ν”Œλ¦¬μΌ€μ΄μ…˜ λ°°ν¬μ—λ§Œ 집쀑할 수 μžˆμŠ΅λ‹ˆλ‹€ (예: Google App Engine, AWS, Azure).
  • SaaS (μ†Œν”„νŠΈμ›¨μ–΄ μ„œλΉ„μŠ€): λͺ¨λ“  ν•˜λ“œμ›¨μ–΄ 및 μ†Œν”„νŠΈμ›¨μ–΄ 인프라와 ν•¨κ»˜ μ™„μ„±λœ μ• ν”Œλ¦¬μΌ€μ΄μ…˜μ„ μ œκ³΅λ°›μ•„ μ‚¬μš©λŸ‰μ— λ”°λ₯Έ λΉ„μš©λ§Œ μ§€λΆˆν•©λ‹ˆλ‹€ (예: Salesforce, Gmail, Google Drive).
3. ν΄λΌμš°λ“œ 배포 λͺ¨λΈ (Deployment Models)
  • 퍼블릭 ν΄λΌμš°λ“œ (Public Cloud): μ—¬λŸ¬ 쑰직이 λ¦¬μ†ŒμŠ€λ₯Ό κ³΅μœ ν•˜λŠ” 닀쀑 ν…Œλ„Œμ‹œ(Multi-tenancy) ꡬ쑰둜, 데이터 νƒˆμ·¨λ‚˜ ν”„λΌμ΄λ²„μ‹œ 문제 μΈ‘λ©΄μ—μ„œ μƒλŒ€μ μœΌλ‘œ λΆˆμ•ˆμ •ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
  • 프라이빗 ν΄λΌμš°λ“œ (Private Cloud): μ˜¨ν”„λ ˆλ―ΈμŠ€ 데이터 μ„Όν„°λ‚˜ ν΄λΌμš°λ“œ 제곡자 내에 자체 κ΅¬μΆ•ν•˜μ—¬ λ³΄μ•ˆμ„ κ°•ν™”ν•˜κ³  μ œμ–΄κΆŒμ„ κ°€μ§‘λ‹ˆλ‹€. ν™•μž₯μ„±, 가상화 및 λΆ€μ„œλ³„ λΉ„μš© 청ꡬ(Chargeback) κΈ°λŠ₯ 등을 κ°–μΆ”κ³  μžˆμŠ΅λ‹ˆλ‹€.
  • ν•˜μ΄λΈŒλ¦¬λ“œ ν΄λΌμš°λ“œ (Hybrid Cloud): 프라이빗과 퍼블릭을 κ²°ν•©ν•œ ν˜•νƒœμž…λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, μ€ν–‰μ˜ λ‚΄λΆ€ μ§μ›μš© μ• ν”Œλ¦¬μΌ€μ΄μ…˜μ€ 프라이빗에, 일반 고객이 μ ‘μ†ν•˜λŠ” λ±…ν‚Ή 앱은 퍼블릭에 λ°°μΉ˜ν•˜λŠ” λ°©μ‹μž…λ‹ˆλ‹€.