"관계형 데이터베이스에서 효율적인 데이터연결" 네번째로 "Outer Join의 원리 및 활용방안"에 대해서 알아보자.

1. 개념 및 원리

Outer Join은 정상적으로 조인 조건을 만족하지 못하는 행들을 보기 위해 사용된다. 즉 어떤 집합을 기준으로 해서 조인되는 다른 집합과의 연결에 실패했더라도 그 결과를 추출하는 조인을 말한다.

 

Outer Join의 연산자는 (+)로 조인시킬 값이 없는 조인측에 (+)를 위치시킨다.

(+)기호는 where절 어디에도 올 수 있으며 Oracle 8i 까지는 한쪽에만 올 수 있었으며 Oracle 9i이후에는 Full Outer Join이라는 절이 이용하여 양쪽 아우터 조인이 가능해졌다.

2. Outer Join 실패

 

아래에 2)번 쿼리의 실행 계획을 확인해보면 분명 Outer Join을 수행한 것으로 나오나 Outer Join을 수행하지 않은 1)번 쿼리와 동일한 결과가 나온다.

 

이유를 보면 연결조건은 Outer join을 하였으므로 두개의 집합은 당연히 Outer join이 되었다. 그러나 d.deptno = 40인 Row들이 조인에는 성공했으나 emp2의 집합은 모두 null 값을 가지게 되므로 마지막 e.empno=7288의 조건은 만족하지않기 때문에 filter로 걸러진다.

이러한 Outer Join실패를 해결하기 위해서는 OuterJoin이 되는 집합에 모두 (+)기호를 붙여 주거나 Outer Join된 결과를 보존하는 하기 위해 null을 조건에 포함 시키는 방법이 있다.

 

3. Outer Join 활용(특이사례)

3.1 Minus 대신 조인으로 처리

집합A에서 집합 B에 있는 것을 빼는 개념으로 Outer Join을 사용할 수 있다.

보통 minus 개념은 minus 구분을 사용하거나 not exists / not in을 사용한다. 그러나 minus의 경우 양쪽집합을 Sort하는 부하가 생기고 not exists / not in의 경우 메인 쿼리의 집합이 많은 경우나 대용량의 경우 메인쿼리에서 서브 쿼리로 가는 랜덤 액세스가 많이 생기는 비효율이 발생한다.

 

이런 비효율을 해결하기 위해 집합 A와 집합B를 outer join한후 inline view로 묶고 B.COL IS NULL을 값을 구하면 (A-B)의 값을 얻을 수 있다.

대용량 데이터의 경우 집합A와 집합B의 Outer Join시 /*+ Use_hash(A B)*/을 사용하면 Nested Loop의 랜덤 액세스의 비효율을 제거할 수 있다.

 

3.2 2개 이상 집합의 Outer Join A = B(+) and B = C(+)

2개 이상의 집합으로 연속적인 Outer Join을 하는경우 대부분의 사용자들은 원집한 보존과 데이터 표시에 있어서 혼돈을 하는 경우가 있다.

아래와 같은 테이블 3개를 Outer Join해야 하는 경우를 예를 들어보자

 

연속적인 Outer Join을 다음과 같이 단계별 조일 결과 집합으로 다음과 같이 쉽게 이해할 수 있다.

 

우선 집합 A와 집합 B의 Outer Join에서 1차 집합을 구한다. B에는 1값이 없으므로 null채워져서 나오고 B의 5값은 A에 없는 값이으로 조인에 실패하여 제외된다.

다음 이 결과집합과 집합 C와 Outer Join을 한다. 집합 C의 5, 6은 1차 집합에 존재하지 않으므로 조인에 실패하여 제외 되고 1차 집합의 4가 집합 C에는 없으므로 Null채워져 나오고 1차집합의 null 값은 2차 집합에 null값으로 대체되어 나온다.

위 결과를 종합해 볼 때 2개이상의 집합으로 Outer Join을 연속으로 하는 경우 최초 결과 집합 A의 개수를 보존하고, 집합 A, B, C 모두 존재하는 경우에만 값이나오고 그렇지 않은 경우에는 Null로 채워지는걸 알수 있다.

3.3. Outer join에서 In / or절 사용 해결 방안

 

Outer Join에서 In /Or절 사용시 에러를 발생 하는 문제는 decode를 사용하여 각각의 조건에 대해 상수값을 지정하고 밖에서 조건별 상수 값을 비교하는 방법으로 해결할 수 있다.

아래 쿼리는 job이 'CLERK'이나 'MANAGER'인 경우는 1을 그렇지 않은 경우에는 2를 내보내고 decode 결과 값이 1인 경우에만 조인에 성공하므로 IN ('CLERK', 'MANAGER')와 같은 결과를 얻을 수 있다.

 

3.4 SubQuery OuterJoin의 해결방안

 

두집합 집합사이에서의 Outer Join은 에러를 발생시킨다. Oracle 8i부터는 다음과 같은 방법으로 해결할 수 있다. 이런경우 결과는 집합이지만 집합이 아니라것을 옵티마이저를 속이기 위해 집합의 결과에 영향을 미치지 않는 문자열을 Concat 시키면 옵티마이저는 집합의 Outer Join이 아니라 상수와의 Outer Join으로 인식하고 에러를 발생시키지 않고 Outer Join의 결과를 정확히 나타낸다.

 

3.5 Access Path의 고정

Outer Join으로 Nested Loop Join을 실행할 때에는 Outer Join여부가 조인의 순서에 영향을 미치므로 주의해야 한다.

위 그림에서 확인할 수 있는 것처럼 TAB1이 먼저 액세스 하여 TAB2를 Outer Join하는 경우 우리가 원하는 결과를 얻을 수 있다.

 

Outer Join은 조인후 성공한 집합을 만들 때 조인에 실패한 경우에도 무조건 성공으로 리턴 시킨다. 그러나 아래 그림처럼 반대 방향으로 조인했을 때 TAB2가 먼저 수행하고 TAB1를 연결하려 한다면 TAB2에 없는 TAB1의 집합을 액세스 하는 것은 논리적으로 불가능하다.

 

그러므로 Nested Loop 조인에서 Outer Join을 수행하는 경우 Outer 되는쪽이 나중에 수행될수 밖에 없어 드라이빙 집합이 고정되어 있으므로 액세스 패스에 주의하여 쿼리를 작성해야 한다.

4. Full Outer 조인

4.1 Oracle 9i 이전의 Full Outer Join 해결 방안

Oracle 9i이전에는 어떤 집합이 Outer Join될 때 비교되는 상대집합은 반드시 하나야만 Outer Join이 가능했었다. 그래서 이런경우 상대집합이 하나이상인 경우 각각을 기준으로 Outer Join을 한 후에 union으로 묶는 방법으로 각 집합에 대해 서로 조인에 실패한 부분도 결과에 포함시켜 얻을 수 있다.

다음은 소속된 사원이 없는 부서와 사원이 소속부서과 부서테이블에 없는 경우 보고자하는 쿼리 이다.

 

4.2 Oracle 9i 에서 Full Outer Join 사용하기

Full Outer Join을 각각 다른 방향으로 Outer Join을 한 후 union을 하면 같은 집합을 2번 읽어야 하는 비효율과 union 하면서 생기는 sort의 부하가 있다. Oracle 9i부터는 Full Outer Join이라는 ANSI 표준 SQL이 지원된다.

위의 쿼리를 Full Outer로 변경하면 다음과 같다.

 

ANSI 표준 SQL을 사용하는 Full Outer Join에는 On절과 Where절에 각각 상수조건에 들어 갈 수 있다.

1) On절에 상수조건이 있는 경우

 

위와 같이 On 절에 상수조건이 들어와 Full Outer Join을 하는 경우 emp 테이블에 deptno가 40인 사원만 dname과 deptno 값이 들어오고 나머지 deptno를 갖는 emp테이블의 값들은 null값으로 매치된다.

Dept테이블 역시 40이외에 다른 deptno로 매치되는 emp에 값이 존재하더라도 D.DEPTNO = 40 조건 때문에 emp쪽 컬럼 값들이 null로 매치가 된다.

On절에 상수조건이 있는 경우 조인조건으로 사용되는걸 알 수 있다.

2) Where에 상수조건이 있는 경우

where절에 조건에 있는 경우는 일반적인 Outer Join에서와 마찬가지로 조인후 걸러지는 체크 조건 값으로 사용된다.

 

위 쿼리는 full outer join후 다시 deptno가 40이거나 emp가 가지고 있는 deptno가 dept에 없는 데이터를 결과로 낸다. 여기서 is null 조건을 빼는 경우 d.deptno= 40만 가지고 equal join한 결과와 같은 값을 내므로 is null이 없는 경우 outer join에서 (+)기호를 생략한 결과와 같다고 할 수 있다.

또한 where d.deptnp(+) = 40 로 사용한 경우 ORA-25156: 이전 방식의 포괄조인(+)은 ANSI 조인과 함께 사용할 수 없음 이라는 에러 메시지가 나오므로 주의해야 한다.

이상으로 Outer Join의 원리와 활용방안에 대해서 알아보았다. 다음 연재는 단계별 데이터의 연결방법에 대해서 알아볼 것이다.

출처 : http://www.oracleclub.com/article/5375   
저자 : 유경진

+ Recent posts