02. 실세계 정보는 어떻게 계산 가능한 데이터가 되는가?

1. 정보와 데이터

  • 정보 : 어떤 특정한 사실, 주제 또는 사건에 대해 전달되는 지식이다. 정보는 조작 될 수 있다.
  • 데이터 : 컴퓨터가 처리할 수 있는 문자, 숫자, 소리, 그림 따위의 형태로 된 정보.

2. 정보를 데이터로 전환하기

  실세계에 대한 정보를 처리하기 위해서 컴퓨터가 사용된다면 이 정보는 먼저 계산 가능한 형태로 변환되어야 한다.
  • 연속적인(continuous) 데이터 : 개별적인 자료가 무한개의 가능한 값을 가진다. 물리적은 또는 실세계를 포함하는 측정값과 관련. ex) 무게
  • 이산적인(discrete) 데이터 : 유한개의 가능한 값을 가진다. 셀수 있는 것과 관련. 
전자공학에서 신호, 오실로스코프 같은곳에서 활용된다.
  • 아날로그(analog) : 연속적인 데이터를 부호화
  • 디지털(digital) : 이산적인 데이터를 부호화
현대 컴퓨팅 시스템들이 디지털인 이유는 디지털 시스템에서 처리해야 할 가능한 값들이 유한개로 정해져 있기 때문이다.

디지털 시스템에서 가장 작은 데이터 단위는 이진수(binary digit) 또는 비트(bit) 이며 컴퓨팅 시스템이 모든 정보를 일련의 비트들로 부호화 한다.

3. 데이터 용량

  데이터를 부호화 하려면 어떤 정보를 저장하기 위해서 얼마나 많은 비트들이 필요한지 알아야 한다. 일반적으로 필요한 비트들의 수는 그 정보가 가질 수 있는 값의 수에 비례한다.컴퓨터 시스템의 데이터 용량(data capacity)은 시스템이 부호화 할 수 있는 정보의 양이다. 바이트(byte)를 측정 단위로 둠.

또 하나의 측정 단위 워드(word) 는 하드웨어에 기분을 둔 데이터 용량 단위. 32비트 나 64비트 프로세서는 특정 컴퓨팅 시스템의 워드 길이를 설명하는 것이다. 워드 길이는 보통 8, 16, 32, 64로 구성되어 있다.

4. 데이터 유형과 데이터 부호화

- 기수법(numeral system) : 기록된 형태로 수를 표현하는 방법

  • 위치 기수법(positional numeral system) : 밑(기수)을 명시한다.
  • 이진,팔진,십진,십육진이 있다.

- 정밀도(precision)

저장된 숫자의 정확성에 대한 측정. 보통 사용할 수 있는 비트들의 수로 측정된다.
숫자 하나에 얼마 만큼 공간을 줄 것인가? 를 정한다.

- 언더플로우와 오버플로우

  • 언더플로우(underflow) 의 예 :  너무 작은값(거의 0에 가까운 값)을 가질 때
  • 오버플로우(overflow)의 예 : 8비트에서 255 + 1을 할때

- 텍스트 문자 부호화

  • 텍스트 문자는 실제로 단지 하나의 그림이라는 것
  • 부호화 방법을 사용하여 정수로 부호화
  • 가장 일반적인 문자 부호 기법은 ASCII 표

- 색상의 부호화

  • 단일 색상은 길이 24의 비트열로 부호화

- 디지털 영상의 부호화

  • 색상을 2차원 격자로 부호화
  • 픽셀(pixel:picture element)

- 소리의 부호화

  • 소리 파형을 아날로그 전기 신호로 변환하기 위해 마이크로폰 사용하여 아날로그 신호가 샘플링 되어 디지털 부호가 생성.
  • 샘플링 : 변화하는 신호의 세기를 일정한 간격으로 측정(값을 할당)해서 기록하는 과정
  • 주파수(frecuency) : 음파가 변화하는 비율
  • 헤르츠(hertz)로 표시 : 초당 바뀌는 사이클의 개수
  • 나이키스트-섀년 샘플링 이론 : 샘플링 비율은 측정된 신호의 가장 높은 주파수보다 최소 두 배가 되어야 한다.
5. 데이터 압축 (Data Compression)
  •  기법 : 손실 있는(lossy) 과 무손실(lossless)로 분류

댓글