Chapter02. 서브쿼리와 성능 문제 이해하기

서브쿼리에 대한 기본 내용 이해하기

서브쿼리란?

- Where절에 비교조건으로 사용되는 Select 쿼리

서브쿼리 동작방식 이해하기

1. Filter 동작방식

Filter 동작방식이 Main SQL추출 결과와 입력 값의 종류에 따라

어떻게 SQL의 성능이 달라지는지 확인해보자.

먼저 유저를 만들고 시작한다.

유저 만드는 법은 알거라 생각하기에 따로 기재하지 않습니다.

필자는 tuner라는 유저를 생성하고 dbs, sysdba라는 권한을 부여한 후,

default tablespace는 users라는 tablespace로 지정을 했습니다.

위 3개의 스크립트를 차례대로 실행한다.

테이블을 어떤 조건으로 생성하는지는 책을 한번 읽어보자.

[테스트1] - Main SQL의 추출 결과가 많고 입력 값이 Unique한 경우

trace 파일을 생셩했으면 생성된 위치(user_dump_dest)로 가서 보기 쉬운 파일로 변환을 하자

tkprof [파일명].trc trace_result.txt sys=no

생성한 파일을 열어서 확인해보자

아래 내용은 결과중 일부를 발췌(?)했다.

[SQL의 실행 계획 설명] – Filter Operation이 있기 때문에 Filter 동작방식으로 수행

1. Subquert_t2 테이블을 Full Table Scan으로 읽으며 “c1 >= :b1 and c1 <= :b2”조건에

만족하는 데이터를 추출 (총 380,001건)

2. 최종 데이터를 추출하기 위해 서브쿼리의 결과도 만족하는지 확인 해야 한다.

서브쿼리로 c1 값을 넘겨준 후 서브쿼리에 결과 값이 존재하는지 확인

(서브쿼리는 c1값을 subquery_t1_idx_01 인덱스를 사용해 총 380,001번 반복 조회 후 최종적으로 230,001건을 추출)

테스트[1]의 SQL트레이스 결과 : Main SQL의 추출 결과 38만건인데 Filter 동작방식으로 수행되다 보니

서브쿼리가 38만번이나 반복적으로 수행. 결국 SQL 전체 I/O발생량 대부분은 서브쿼리에서 반복적으로

사용하는 subquery_t1_idx_01 인덱스에서 발생.

[테스트2] - Main SQL의 추출 건수가 적고, Input 값이 Unique 한 경우

테스트[2]의 SQL트레이스 결과 : Filter동작방식으로 수행되지만, Main SQL의 조건이 효율적이어서 추출되는

데이터 건수가 총 5건이다. 그래서 서브쿼리도 5번만 수행되기 때문에, SQL의 성능은 테스트[1]과 비교해서

매우 양호하다

[테스트3] – Main SQL의 추출건수는 많지만, Input 값의 종류가 26가지인 경우

alter session set events '10046 trace name context forever, level 12';

sql_test03.sql

alter session set events '10046 trace name context off';

트레이스 결과 : Main SQL의 추출 건수는 380,001건으로 상당히 많지만, 입력 값은 26가지에 불과

테스트[3]의 서브쿼리는 Mail SQL의 추출 결과만큼 매번 수행하지 않는다.

- 서브쿼리의 입력 값을 cache하여, 입력 값이 같을 경우 서브쿼리를 수행하지 않기 때문

서브쿼리의 수행 횟수는 입력 값의 종류만큼인 26번만 수행되어 성능이 양호

3 가지의 테스트를 통해 서브쿼리가 Filter 동작방식으로 수행될 경우 Main SQL추출 결과와 입력 값의

종류에 따라 성능이 어떻게 달라지는지 확인했다.(분명)

[정리]

Filter 동작방식은 Main SQL의 추출결과가 많고 서브쿼리에 제공해 주는 값(입력 값)의 종류가 많으면

성능이 좋지 않다. 하지만 Main SQL의 추출건수가 적거나, Main SQL의 추출결과가 많다고 해도 입력 값의

종류가 적은 경우 Filter 동작방식으로 수행되는 SQL의 성능은 양호하다.

Filter 동작방식의 경우 항상 Main SQL이 먼저 수행되고, 서브쿼리는 Main SQL에서 추출된 데이터의 값을

전달 받아 매번 확인하는 형태로 수행된다. Filter Operation은 한가지 방법만 고수해서 다양한 상황에서

유연하게 대처하기가 어렵다. 그래서 서브쿼리가 Filter 동작방식으로 수행되는 경우 SQL성능이 좋지 않은

경우가 많다.

SQL의 실행계획을 점검하다 서브쿼리가 Filter 동작방식으로 수행되고 있으면, 먼저 서브쿼리의

조인 연결 컬럼에 인덱스가 존재하는지 확인

- 서브쿼리가 Filter 동작방식으로 수행되는데, Full Table Scan으로 처리하고 있다면, 심각한

성능문제가 발생할 수 있기 때문이다.

2. 조인 동작방식

조인 동작방식의 차이점은 가변성이다.

Filter 동작방식은 수행 순서, 수행 방법에 있어서 고정이다.

조인 동작방식은 NL Join, Hash Join, sort merge Join, Semi Join, Anti Join이 있고

이중 유리한 것을 선택할 수 있다. Semi, Anti Join을 제외하고 수행 순서까지 선택할 수

있어 유연하게 처리가 가능하다.

NL Join Semi를 제외한 나머지 조인 방법은 Filter 동작 방식이 가지고 있는 Filter Operation

효과에 의한 이득을 얻지 못한다. 따라서 입력 값의 종류가 적은 경우 Filter 동작방식이 유리할 수도 있다.

SQL Trace의 결과를 보면서 조인 동작방식 원리 및 Filter 동작방식의 성능차이가 어디서 발생하는지

자세히 알아보자. 아래의 SQL을 Filter / Join 동작방식으로 수행하고, 성능차이를 비교함으로써

성능 차이가 발생하는 이유를 알아보자

테스트 SQL은 Filter 동작방식으로 수행되어 문제가 발행하고 있다. Filter 동작방식이 가지고 있는 문제점을

알아보고 조인 동작방식으로 변경했을 때 성능의 변화를 알아보자.

테스트[1] – Filter 방식으로 수행되어 성능 문제가 발생하는 SQL

sql_test04.sql

테스트[1]의 경우 Filter 동작방식으로 수행되었고, table t1의 컬럼 c6에 인덱스가 없어

Main SQL의 추출 건수만큼 subquery_t1테이블을 반복으로 Full Table Scan하고 있다.

subquery_t1의 컬럼 c6에 인덱스를 생성해 주면 성능이 개선될 것이다. 실 운영환경에서는

잘 고려해서 선택하자.

인덱스를 생성하려면 우선 subquery_t1 테이블을 액세스하는 다른 SQL의 실행계획에

미치는 영향과 트랜잭션 프로그램 부하도 고려해야 하고, 인덱스 추가에 따른 용량 증가도 고려해야 한다.

테스트[1]의 성능 개선을 하기 위해 FTS을 줄여야 하므로 서브쿼리를 조인동작 방식으로 변경하고

Hash Join Semi로 변경하자.(unnest hash_sj)

sql_test04_1.sql

call     count       cpu    elapsed       disk      query    current        rows
------- ------ -------- ---------- ---------- ---------- ---------- ----------
Parse        1      0.00       0.00          0          0          0           0
Execute      1      0.00       0.00          0          0          0           0
Fetch        2      1.20       1.18         16      37420          0          11
------- ------ -------- ---------- ---------- ---------- ---------- ----------
total        4      1.20       1.18         16      37420          0          11

Misses in library cache during parse: 0
Optimizer mode: ALL_ROWS
Parsing user id: 29

Rows     Row Source Operation
------- ---------------------------------------------------
     11     FILTER (cr=37420 pr=16 pw=0 time=37914 us)
     11     HASH JOIN SEMI (cr=37420 pr=16 pw=0 time=37906 us)
    221      TABLE ACCESS BY INDEX ROWID SUBQUERY_T2 (cr=6 pr=0 pw=0 time=965 us)
    221       INDEX RANGE SCAN PK_SUBQUERY_2 (cr=4 pr=0 pw=0 time=279 us)(object id 10614)
6400640   TABLE ACCESS FULL SUBQUERY_T1 (cr=37414 pr=16 pw=0 time=12679 us)

기존의 Filter 동작방식이 아닌 조인 동작방식으로 변경되었고, 조인은 Hash Join Semi로 수행

실행계획의 변경은 SQL이 Filter동작방식으로 수행되어 221번 반복되는 FTS을 제거하고,

한번만 FTS를 하도록 변경된 것이다.

개선 전의 SQL의 경우 인덱스가 없는 것이 비효율적이기도 하지만, 인덱스를 생성하기 힘든 경우,

힌트를 사용해서 동작방식을 변경하는 것 만으로도 개선 효과를 볼 수 있다.

테스트[2] – Main SQL의 추출 건수는 매우 많고 서브쿼리에 있는 상수 조건이 매우 효율적이어서

서브쿼리를 먼저 수행해야 효율적인 처리가 되는 SQL이 있다고 가정한다.

sql_test05.sql

call     count       cpu    elapsed       disk      query    current        rows
------- ------ -------- ---------- ---------- ---------- ---------- ----------
Parse        1      0.00       0.00          0          0          0           0
Execute      1      0.00       0.00          0          0          0           0
Fetch       23     76.58      74.95       8106   63908411          0         320
------- ------ -------- ---------- ---------- ---------- ---------- ----------
total       25     76.58      74.95       8106   63908411          0         320

Misses in library cache during parse: 0
Optimizer mode: ALL_ROWS
Parsing user id: 29

Rows     Row Source Operation
------- ---------------------------------------------------
    320 FILTER (cr=63908411 pr=8106 pw=0 time=874 us)
16000000   FILTER (cr=37435 pr=8106 pw=0 time=140 us)
16000000    TABLE ACCESS FULL SUBQUERY_T1 (cr=37435 pr=8106 pw=0 time=14219 us)
      5   FILTER (cr=63870976 pr=0 pw=0 time=59553122 us)
      5    TABLE ACCESS BY INDEX ROWID SUBQUERY_T2 (cr=63870976 pr=0 pw=0 time=53849622 us)
15967744     INDEX UNIQUE SCAN PK_SUBQUERY_2 (cr=47903232 pr=0 pw=0 time=32029726 us)(object id 10614)

위 SQL을 Filter 동작 방식이 아닌 조인 동작방식(Hash Join Semi)으로 유도 했을 때 변화를 보자.

sql_test05_1.sql

call     count       cpu    elapsed       disk      query    current        rows
------- ------ -------- ---------- ---------- ---------- ---------- ----------
Parse        1      0.00       0.00          0          0          0           0
Execute      1      0.00       0.00          0          0          0           0
Fetch       23      2.69       2.64       5088      38751          0         320
------- ------ -------- ---------- ---------- ---------- ---------- ----------
total       25      2.70       2.65       5088      38751          0         320

Misses in library cache during parse: 1
Misses in library cache during execute: 1
Optimizer mode: ALL_ROWS
Parsing user id: 29

Rows     Row Source Operation
------- ---------------------------------------------------
    320 FILTER (cr=38751 pr=5088 pw=0 time=33494 us)
    320   HASH JOIN RIGHT SEMI (cr=38751 pr=5088 pw=0 time=33485 us)
      5    TABLE ACCESS FULL SUBQUERY_T2 (cr=1316 pr=655 pw=0 time=179 us)
16000000    TABLE ACCESS FULL SUBQUERY_T1 (cr=37435 pr=4433 pw=0 time=233 us)

기존 SQL에서 1600만번 반복 수행을 제거해서 성능을 크게 개선했다. 하지만 320건의 결과만 나오고 Subquery_t1테이블에 대해

FTS으로 인해 처리시간이 4초나 소요되었다.

이것을 더 개선 시켜 보자. Subquery_t2의 추출된 5건으로 Subquery_t1과 조인 처리 후 최종 320건으로 추출되는 것에 있다

그래서 Subquery_t2를 먼저 처리하고, Subquery_t1 테이블과 NL Join을 수행하면 성능이 개선될 것이다.

따라서 서브 쿼리를 먼저 수행하고, NL_SJ 힌트를 사용하여 SQL을 수행해보자.

SQL을 개선하는 방법 두 가지

1. SQL 변경(O): 서브 쿼리를 조인으로 변경해서 실행 계획 유도

2. SQL 변경(X): 서브쿼리와 Main SQL에 조인 순서(LEADING), 조인 방법(NL_SJ), Query Block(QB_name)힌트를 추가 해서 실행 계획 유도

call     count       cpu    elapsed       disk      query    current        rows
------- ------ -------- ---------- ---------- ---------- ---------- ----------
Parse        1      0.00       0.00          0          0          0           0
Execute      1      0.00       0.00          0          0          0           0
Fetch       23      0.02       0.02          0       1673          0         320
------- ------ -------- ---------- ---------- ---------- ---------- ----------
total       25      0.02       0.02          0       1673          0         320

Misses in library cache during parse: 1
Misses in library cache during execute: 1
Optimizer mode: ALL_ROWS
Parsing user id: 29

Rows     Row Source Operation
------- ---------------------------------------------------
    320 FILTER (cr=1673 pr=0 pw=0 time=26847 us)
    320   TABLE ACCESS BY INDEX ROWID SUBQUERY_T1 (cr=1673 pr=0 pw=0 time=26521 us)
    326    NESTED LOOPS (cr=1353 pr=0 pw=0 time=2489836 us)
      5     SORT UNIQUE (cr=1316 pr=0 pw=0 time=22979 us)
      5      TABLE ACCESS FULL SUBQUERY_T2 (cr=1316 pr=0 pw=0 time=126 us)
    320     INDEX RANGE SCAN SUBQUERY_T1_IDX_01 (cr=37 pr=0 pw=0 time=66 us)(object id 10610)

더욱 성능이 개선 되었다.

3. 서브쿼리 동작방식을 제어하는 힌트들

Hint Name	설명
No_unnest	서브쿼리를 Filter로 처리할때 사용
unnest	조인 동작방식으로 처리할때 사용
NL_SJ	exist, in 조건을 사용한 경우 서브쿼리에 unnest와 함께 사용하면 NL Join Semi로 처리하도록 제어
Hash_SJ	exist, in 조건을 사용한 경우 서브쿼리에 unnest와 함께 사용하면 Hash Join Semi로 처리하도록 제어
NL_AJ	Not(exist, in) 조건을 사용한 경우 서브쿼리에 unnest와 함께 사용하면 NL Join Anti로 처리하도록 제어
Hash_AJ	Not(exist, in) 조건을 사용한 경우 서브쿼리에 unnest와 함께 사용하면 Hash Join Anti로 처리하도록 제어
ORDERED	from절의 컬럼 순서로 수행하도록 조인 순서를 정하는 힌트(서브쿼리를 먼저 수행)
QB_NAME	Query Block의 이름을 지정
SWAP_JOIN_INPUT	Hash Join시 사용하면 조인 순서를 변경할 수 있다.
NO_SWAP_JOIN_INPUT	조인 순서가 바뀌는 경우 강제로 변경하지 못하게 한다.
PUSH_SUBQ	서브쿼리가 먼저 수행되도록 제어 하는 힌트

위 표로 정리 하니까 이해 하기가 쉬운듯 하다.

연습 문제

예제 SQL

example.sql

1. 예제 SQL의 서브 쿼리를 Filter 방식으로 수행되도록 제어하세요.

(참고 : no_unnest 힌트를 사용)

explain plan for
select c4, c5, c6
from subquery_t1 t1
where c6 >= :b1
and c6 <= :b2
and exists (select /*+ no_unnest */ 'x'
  from subquery_t2 t2
  where t2.c1 = t1.c4
  and t2.c3 >= :b3
  and t2.c3 <= :b4);