3. 추상화와 타입
대표적인 현실 세계의 추상화의 예시로 꼽히는 해리 벡(Harry beck)의 런던 지하철 지도
좌측은 사실적인 지형과 축척에 의거하여 그린 지도,
우측이 해리 벡이 연결성에 집중하여 그린 지도이다.
출처 sheilapontis : Evidence-based information design principles
3.1. 추상화
현실 세계는 매우 복잡하고 예측이 불가능한 세계이다.
이런 현실 세계에 존재하는 객체를 소프트웨어 세계로 옮기기에는 많은 제약사항이 존재하므로
이를 이해하기 쉽고 예측 가능한 수준으로 분해하고 단순화해야한다.
따라서 진정한 의미의 추상화란 현실에서 출발하되 불필요한 부분을 배제해나가면서 사물의 본질을 드러나게 하는 과정 이라고 볼 수 있다.
다만 어떠한 추상화라도 의도된 목적이 아닌 다른 목적으로 사용되는 경우엔 잘못된 결과를 야기할 수 있따.
추상화의 수준과 이익 그리고 가치는 추상화의 목적에 의존적이기 때문이다.
따라서 추상화에 대해서 아래와 같이 정의할 수 있겠다.
추상화 란 어떠한 양상, 세부 사항, 구조를 좀 더 명확하게 이해하기 위해서 특정 절차나 물체를 의도적으로 배제하거나 감춤으로서 복잡도를 낮추는 방법이다.
이 복잡도를 낮추기 위한 추상화는 두 가지 차원에서 이루어진다.
첫 번째는 일반화 이다. 구체적인 사물들 간의 공통점은 취하고 차이점을 버리면서 단순하게 만든다.
두 번째는 단순화 이다. 중요한 부분을 강조하고 불필요한 세부사항을 배제한다.
모든 추상화의 목적은 복잡도를 낮추어 이해하기 쉽도록 단순화하는 것이다.
3.1.1. 객체지향과 추상화
그렇다면 객체지향 입장에서 추상화는 어떻게 받아들어야할까?
객체지향 패러다임을 통해 우아한 애플리케이션 개발을 위해선 일반화와 단순화를 올바르게 이해하고 적용하는 습관이 필요하다.
지금 고속도로를 쳐다보고 있다고 가정해보자.
고속도로 위에는 버스, 승용차, 트럭 등등 수많은 종류의 차들이 있을테지만 우리는 “자동차”라는 카테고리로 추상화할 수 있을 것이다.
또한 위에서 언급한 버스도 여러 종류가 있겠지만 버스라는 그룹으로 묶을 수 있고, 승용차도 트럭도 그룹으로 묶을 수 있을 것이다.
이렇게 사람들은 공통적인 특성을 기준으로 객체를 여러 그룹으로 묶어서 생각하는 본능이 있다.
이처럼 공통점을 기반으로 객체들을 묶기 위한 그릇을 개념(concept) 라고 한다.
개념이란 일반적으로 우리가 인식하고 있는 다양한 사물이나 객체에 적용할 수 있는 아이디어나 관념을 뜻한다.
이 개념을 이용하면 객체를 여러 그룹으로 분류(classification) 할 수 있다.
결과적으로 개념은 공통점을 기반으로 객체를 분류할 수 있는 일종의 필터로서의 역할을 수행한다.
객체에 어떤 개념을 적용하는 것이 가능해서 특정 그룹의 일원으로 분류될 때, 이 객체를 그 개념의 인스턴스(instance) 라고 한다.
개념에 대해 인지한 상태로 객체를 재정의해보자.
객체란 특정한 개념을 적용할 수 있는 구체적인 사물을 의미한다.
개념이 객체에 적용되었을 때 객체를 개념의 인스턴스라고 한다.
3.1.2. 개념의 세가지 관점
개념은 특정 객체가 어떤 그룹에 속할 것인지 결정한다.
즉, 어떤 객체에 어떤 개념이 적용됐다고 할 때는 그 개념이 부가하는 의미를 객체가 만족시켰다는 것을 의미한다.
일반적으로 객체의 분류 장치로서 개념을 이야기할 때는 아래 세가지 관점을 같이 언급한다.
- 심볼(symbol) : 개념을 가리키는 간략한 이름이나 명칭
- 내연(intension) : 개념의 완전한 정의, 내연의 의미를 이용해 객체가 개념에 속하는 지를 검증할 수 있다.
- 외연(extension) : 개념에 속하는 모든 객체의 집합(set)
외연의 관점에서 어떤 객체에 어떤 개념을 적용할 수 있다는 것은 동일한 개념으로 구성된 객체 집합에 해당 객체를 포함시킨다는 것을 의미한다.
객체에 어떤 개념을 적용할 것인지 결정하는 것은 결국 객체들을 개념에 따라 분류하는 것과 동일하다고 볼 수 있다.
따라서 분류는 아래와 같이 정의할 수 있을 것이다.
분류란 객체에 특정한 개념을 적용하는 작업이다.
객체에 특정한 개념을 적용하기로 결심했을 때 우리는 그 객체를 특정한 집합의 멤버로 분류하게 된다.
분류라고 하는 것은 추상화를 위한 도구로 객체지향의 가장 중요한 개념 중 하나이다.
어떤 객체를 어떤 개념으로 분류할지가 객체지향의 품질을 결정하기 때문이다.
객체를 적절하게 분류했다면 용이한 유지보수성을 확보하고 요구되는 변경 사항에 유연하게 대처할 수 있게 된다.
더욱 중요한 것은 적절한 분류 체계가 개발자의 머릿속에 객체를 쉽게 찾고 조작할 수 있는 지도를 제공한다는 점이다.
따라서 우리는 최대한 직관적으로 객체를 분류할 필요가 있다.
3.2. 타입
위에서 개념이라는 것에 대해 살펴보았다.
하지만 공학자들은 개념(concept)라는 말보다 좀 더 와닿는 단어를 차용했는데, 이 단어가 바로 타입(type) 이다.
타입의 정의는 개념과 완전히 동일하기때문에 심볼 / 내연 / 외연을 이용해 서술할 수 있다.
개념의 정의를 타입으로 치환해본다면 아래와 같다.
어떤 객체에 타입을 적용할 수 있을 때, 그 객체를 타입의 인스턴스라고 한다.
데이터 타입
컴퓨터가 어떤 작업을 수행하기 위해서는 작업에 필요한 데이터를 메모리에 적재해야 한다.
사람들은 편의를 위해 자신이 다뤄야하는 데이터의 용도와 행동에 따라 이를 분류하기 시작하면서 타입 시스템이 자리잡기 시작하였다.
타입에 대한 두 가지 중요한 점에 대해 서술해보면 아래와 같다.
- 타입은 데이터가 어떻게 사용되느냐에 관한 것이다.
숫자형 데이터는 데이터에 대한 사칙연산을 수행할 수 있기에 숫자형이,
문자열형 데이터는 데이터를 연결해 서로운 문자열을 만들 수 있기에 문자열형이라고 불리운다.
이처럼 어떤 데이터에 어떤 연산자(operator)를 적용할 수 있는 가가 그 데이터의 타입을 결정한다.
- 타입에 속한 데이터가 메모리에 어떻게 적재되는 지는 알 필요가 없다.
우리는 데이터를 어떻게 사용하는지에 대한 연산만 알고 있으면 되고, 메모리 상에서 어떻게 저장되고 표현되는 지는 알 필요가 없다.
좀 더 정확히는 알지 못해도 데이터 타입을 사용하는 데 문제가 없다.
이 데이터 타입은 프로그래밍 언어 관점에서 아래와 같이 정의된다.
데이터 타입은 메모리 안에 저장된 데이터의 종류를 분류하는 데 사용하는 메모리 집합에 관한 메타데이터다.
데이터에 대한 분류를 암시적으로 어떤 종류의 연산이 해당 데이터에 대해 수행될 수 있는지를 결정한다.
3.2.1. 객체와 타입
데이터 타입에 대해 자세히 알아야하는 이유는 전통적인 데이터 타입과 객체지향의 타입 사이에 연관성이 있기 때문이다.
실제로 객체지향 프로그램을 작성할 때 우리는 객체를 일종의 데이터처럼 사용한다.
객체를 타입에 따라 분류하고 그 타입에 이름읇 붙이는 새로운 데이터 타입을 선언하는 것과 마찬가지가 되는 것이다.
그렇다면 객체는 데이터일까?
정답은 “아니” 이다.
객체는 객체의 행위가 중요하며, 상태는 행위의 결과를 쉽게 표현하기 위한 추상적 개념일 뿐이기 때문이다.
데이터 타입에 맞추어 객체의 타입을 재정의해보면 아래와 같다.
- 객체의 타입을 결정하는 것은 객체의 행위이다.
동일한 행위를 수행하는 객체들은 동일한 타입으로 분류 될 수 있다.
- 객체의 내부적인 표현을 외부로부터 감춰진다.
객체의 행위를 효과적으로 수행할 수 있다면 상태를 어떤 방식으로 표현하더라도 상관이 없다.
3.2.2. 타입의 계층
객체지향에는 타입과 타입 사이에 일반화(generalization) 관계 와 특수화(specialization) 관계가 존재한다.
일반화란 하위 타입에 속하는 객체들의 공통 분모를 뽑아올려 상위 계층의 타입을 정의하는 방법이며,
특수화란 상위 타입의 공통적인 부분을 구체화하거나, 자신만의 독자적인 부분을 추가하는 식으로 이루어진다.
거듭말하지만 여기서 중요한 것은 일반화/특수화 관계를 결정하는 것은 객체의 상태가 아닌 객체의 행위이다.
이 일반화/특수화 관계의 대표적인 예시가 바로 상속(hierarchy) 이다.
상속 관계에서는 슈퍼 클래스와 서브 클래스로 분류가 됨을 우리는 이미 알고 있다.
즉 슈퍼 클래스(=슈퍼 타입)으로 갈수록 좀 더 일반적인 행위를 수행할 것이고,
서브 클래스(=서브 타입) 으로 갈수록 좀 더 특수한 행위를 수행하게 될 것이다.
이처럼 객체지향 패러다임을 통해 세상을 바라보는 경우 일반화/특수화 기법을 동시에 사용하게 된다.
3.2.3. 타입의 목적
객체지향은 객체만 필요하지 타입은 왜 필요한 걸까?
타입을 사용하는 이유는 인간의 인지 능력으로는 시간에 따라 동적으로 변하는 객체의 복잡성을 극복하는 것이 어렵기 때문이다.
타입을 이용하면 시간에 따라 동적으로 변하는 객체의 상태를 시간과 무관하게 정적인 객체로 다룰 수 있게 해준다.
이런 관점에서 타입은 결국 추상화를 위한 도구가 맞다.
시간에 따른 객체의 불필요한 변경을 배제하고 단순화해주기 때문이다.
본 포스팅의 내용을 쭉 살펴보면 우리는 객체를 생각할때 두 가지 모델을 동시에 고려한다는 점을 알 수 있다.
하나는 객체가 특정 시점에 어떤 상태를 가지느냐를 고려한다.
객체의 생명주기 동안 상태가 어떻게 변하고 어떤 행위를 하는지 포착하는 것을 동적 모델(dynamic model) 이라고 한다.
다른 하나는 객체가 가질 수 있는 모든 상태와 모든 행위를 시간과 무관하게 표현하는 것이다.
이 방법은 동적으로 변하는 객체의 상태가 아니라 객체가 속한 타입의 정적인 모습을 표현하기에 정적 모델(static model) 이라고 하며
타입 모델(type diagram) 이라고도 한다.
객체지향 애플리케이션을 설계하고 구현하기 위해서는 객체 관점의 동적 모델과 객체를 추상화한 타입 관점의 정적 모델을 혼용해야 한다.