※ 2023. 3. 17.(금) 08:00에 업데이트될 예정입니다.

※ 2023. 5. 1.(월) 17:57에 업데이트 완료

 

========== 오늘 수업에서 얻어갈 것 ==========

ⓞ 수능국어 메타에 대한 고민
【맥락】 독서(비문학) 지문이 점점 더 어려워지고 점점 더 길어져 왔다. 세트당 문항 수도 점점 더 많아져 왔다.

【고민】 이런 맥락 속에서, 우리가 ⚞아무 단서 없는 상태로⚟ 지문부터 읽었을 때, 과연 지문을 얼마나 이해할 수 있을까? 그 정도로 이해해서 충분할까? 그리고 그 세트의 모든 문항을 다 풀 때까지 지문 내용에 대한 나의 이해나 기억이 지속될 수 있을까? 결국 지문을 두 번, 세 번, 네 번씩 읽은 경험이 있지는 않나?

【제안】 그래서 ⚞선 문제 후 지문⚟ 메타를 너희에게 소개한다. 지문부터 읽지 말고 문제 손질을 다 마친 후에야 지문을 읽는 식으로 푸는 것이다. 그러면 지문을 단 1회독만 해도 필요한 것 다 제대로 포착하고 파악할 수 있어서 신속성, 안정성, 지속가능성 면에서 오히려 이득일 수 있다. 이제 선 문제 후 지문 스타일을 수업 시간에 시범 보일 테니, 너희가 선택 가능한 수능 국어 ‘풀이폼(solving style)’은 한 가지가 아님을 환기하고 각자에게 최적인 폼을 찾아 잘 정착하길 바란다. 그리고 신속성, 안정성, 지속가능성. 항상 중요하게 생각해라.


① 신속성, 안정성, 지속가능성
【신속성】 시간이 덜 걸리려면?
【안정성】 문제를 덜 틀리려면?
【지속가능성】 80분 시험시간에서 중·후반에 가도 페이스가 떨어지지 않으려면?(=덜 지치면서 풀려면?)
세화고 학생들 상당수는 굉장히 어려운 비문학 세트도 어찌어찌 정답을 꽤 맞히더라. 하지만 그건 어디까지나 한 세트만 풀 때의 얘기였다. 실제 시험에서 신속성, 안정성, 지속가능성이 잘 나오는 풀이폼이 무엇일지 고민해서 적어도 6월 대수능 모의평가(앞으로 ‘6평’) 전까지는 각자의 최적 풀이폼을 잘 잡아 보자. 참고로 ‘선 문제 후 지문’ 메타의 풀이폼은 지금껏 가르쳐 본 결과, 대체로 개인차 안 타고 효과가 있었다.


② ‘선 문제 후 지문’의 실제
5~6문제짜리 세트의 경우 문제 손질에 3분30초~4분30초 정도가 걸린다. 결코 짧은 시간이 아니다. 대신, 지문을 한 번 다 읽는 데 4분 정도가 걸리고, 지문 한 번 읽는 동안에 모든 문제가 풀린다. 결과적으로 7분30초에서 8분30초 정도에 클리어할 수 있다. 그리고 지문을 아무 단서 없이 읽는 게 아니라, 문제 손질하며 얻은 힌트를 바탕으로 읽고, 머릿속에 담아둔 바(=풀이선상에 올려둔 바)를 의식하며 읽다 보니 지문 읽기가 덜 막연하고 덜 막막하다(안정성↑, 신속성↑). 또한 지문이나 문제에서 버벅이는 경우, 벽에 부딪혀 엉덩방아 찧는 느낌 등을 덜 받고 스무스하게 계속 풀이를 진행할 수 있다. 다시 말해 ‘지문은 진작에 다 읽었는데 아직도 이 세트에 붙잡혀 있네ㅠㅠ’가 아니게 된다. 지문 딱 1회독 끝마쳤을 때 바로 다음 세트로 가는 식으로 풀게 된다. 결과적으로 피로도가 덜 쌓이고 오히려 가속도가 붙으면서 풀린다(지속가능성↑)
【요약】 길게 이야기했는데, 지문을 단서가 충분한 상태에서 읽어 보자는 취지이다.


③ ‘선 문제 후 지문’ 첫 번째 지침. 내용 파악 문제는 [적절한 것은?] 쪽이면 선지를 편안하게만 읽어 보고 넘어가고, [적절하지 않은 것은?] 쪽이면 선지를 하나하나 꼼꼼히 읽으며 풀이선상에 적절히 추려서 올려 두어라.
왜냐하면 [적절한 것은?]의 경우 5개 중 4개가 엉터리 진술이고, [적절하지 않은 것은?]의 경우 5개 중 4개가 지문과 싱크(sync)가 맞는 진술이기 때문이다.


④ 두 번째 지침. 문제 손질할 때 probably O/X를 표시할 수 있는 선지는 표시하자.
【probably O】 아마 적절할 것 같은 선지
【probably X】 아마 적절하지 않을 것 같은 선지
나는 probably O는 점선 동그라미, probably X는 점선 엑스로 표시한다.


========== 과학기술 08강이 풀리는 흐름 (상) ==========
※ 적용 폼: 언더핸드

(전체를 살짝 눈으로 보니)
‘음, 다섯 문제짜리 세트고, 그림·도표? 같은 것들 상태 보니 아마 과학기술 쪽인 듯’



(1번 문제를 본다) ‘내용 파악, [적절한 것은] 쪽이네.’
(1번 문제 선지들을 편안하게 읽어본다)
결측치...
결측치의 처리..
제2사분위수
제1사분위수.. 데이터값.. 최댓값..
“⑤ 이상치를 판정하는 기준은 데이터 분석의 결과에 영향을 줄 수 있다.”

‘일단 앞에 나온 말들이 결측치, 데이터값, 최댓값 같은 것들이니까 ⑤번 선지에서 ‘이상치’도 수치를 뜻하겠지. 그렇다면 5번 선지는 적절할 수밖에 없는 말 아닌가?’
⇒ ⑤ probably O.
⇒ 그리고 이 지문이 데이터값에 대한 지문이라는 단서를 얻음.



(2번 문제를 본다) ‘내용 파악, [적절하지 않은 것은] 쪽이네. 그리고 기호가 있네(㉠).’
(지문에서 ㉠을 찾아 그 문장 하나는 지금 읽어 본다)
“㉠이상치는 정상적인 범위 밖에 있는 값으로, 단 하나라도 존재하면 분석 전체에 큰 영향을 미칠 수 있다.”
⇒ ㅇㅋ. 이상치가 정상이 아닌 값이라는 의미. 그러면 1번 문제는 더더욱 답이 5번인 듯.

(이제 2번 문제 선지들을 제대로 살펴본다.)
“① 데이터 분석 전에 찾아서 제거해야 한다.”
분석 전에.. 제거해야..
⇒ 이상치를 어느 시점에서 어떻게 해야 하는지에 대한 내용이 나오면 바로 처치.

“② 허용 상한값과 허용 하한값의 사이에는 존재하지 않는다.”
⇒ 이상치의 존재 위치에 대한 내용이 나오면 바로 처치.

“③ 제1사분위수보다 크거나 제3사분위수보다 작은 것이 일반적이다.”
⇒ 이상치의 분포에 대한 내용이 나오면 바로 처치.

“④ 데이터 분석을 교란하여 제대로 된 결과를 얻지 못하게 할 수 있다.”
⇒ pobably O

“⑤ 데이터의 수집 과정에서 어떤 오류가 개입하여 발생한 것으로 간주된다.”
수집 과정에서.. 오류가 개입하여 발생한 것으로 간주된다….
⇒ 수집 과정에서, 간주된다. 체크.

【풀이선상】
- 이상치는 어느 시점에서 어떻게 처리해야 하는 값일까?
- 이상치의 존재위치, 분포
- “수집 과정에서” 오류가 개입하여 발생한 것으로 간주된다.



(3번 문제를 본다) ‘지문에 있는 <그림 3>에 대한 적용·분석 문제네. 그리고 기호가 있네(㉡).’
(지문에서 ㉡을 찾아 그 문장 하나는 지금 읽어 본다)
“㉡결측치를 처리하는 방법은 삭제와 대체가 일반적이다. 삭제란 ……”
⇒ <그림 3>에 결측치가 있나 보네? 그리고 처리 방법은 삭제 또는 대체….

(3번 문제 선지들에 대해 한 번 미리 해 볼 수 있는 것 해 보자)
“① salary 열 1번 행의 결측치를 ‘1095.0’으로 대체하면 추가적인 정보의 망실이 일어난다.”
⇒ 망실. lost. 부적절한 값으로 대체하면 왜곡이나 뭐 그런 게 일어날 순 있어도 망실이 일어난다.?
⇒ probably X.

“② salary 열 2번 행의 결측치를 ‘0’으로 적으면 삭제의 방법으로 결측치를 처리한 것이다.”
⇒ (인터넷에서 봤던 짤이 떠오르며…) 0도 데이터값인 것 같은데… 따지자면 0으로 대체한 것 아닌가?
⇒ probably X.
※ 인터넷에서 “0과 null의 차이.jpg”를 검색해 보세요.
⇒ 그리고 ‘NaN’이 결측치를 뜻한다는 걸 알게 됨.

“③ sales 열 4번 행의 결측치를 평균으로 대체하려면 9개의 데이터 값의 평균을 구해야 한다.”
⇒ 4번 행 말고 행이 9개이긴 한데… 9개 중 1개는 NaN인데…? 이걸 끼고 어떻게 평균을 구하지?
⇒ probably X.

“④ sales 열 5번 행의 결측치를 포함하는 행을 삭제하면 다른 3개의 데이터 값이 함께 삭제된다.”
⇒ 5번행은 sales 열 데이터 빼고 나머지 데이터는 모두 숫자임.
⇒ probably O. 

“⑤ roe 열 9번 행의 결측치는 확보된 데이터 값들의 중앙값으로 대체하면 ‘13.800000’으로 바뀐다.”
⇒ 과연 4행의 값이 중앙값일지.

【풀이선상】
- 이상치는 어느 시점에서 어떻게 처리해야 하는 값일까?
- 이상치의 존재위치, 분포
- “수집 과정에서” 오류가 개입하여 발생한 것으로 간주된다.
[추가] - 중앙값?



(4번 문제를 본다) ‘얘가 이 세트 대장이네. 역시 적용 문제.’
(<보기>를 읽어봤다.)
“…IQR…”
⇒ 아싸, 기본적으로는 지문에서 IQR 나오면 그때 가서 해결될 선지들이 있겠군.
※ ‘선 문제 후 지문’ 메타로 가면, 생전 처음 보는 용어라 어구가 나오면 나올수록, 오히려 반갑다. 걔네들이 단서를 선명하게 잡아주기 때문이다.

(4번 문제 선지들도 읽어보면서 한 번 미리 해 볼 수 있는 것 해 보자)
“① 통근 시간 열의 ‘180’은 이상치가 아니다.”
⇒ 어디 보자. 값들이 60~300이니까… probably O

“② 판매량 열의 데이터에서 제2사분위수는 ‘500’이다.”
⇒ 제2사분위수가 뭘까?

“③ 통화 시간 열의 허용 상한값 위의 이상치는 2개이다.”
⇒ 어디 보자. 1~7… 14, 50 얘네 둘이 너무 튀네. probably O

“④ 어떤 영업 사원의 독서 시간 미상이 결측치를 유발했다.”
⇒ 0번 행의 경우 독서시간이 NaN이네. 3번 문제 푼 바로는 NaN=결측치. probably O

“⑤ 통화 시간 열로 그린 상자 수염 도표의 상자 높이는 8이다.”
⇒ 상자 수염 도표가 뭘까?

【풀이선상】
- 이상치는 어느 시점에서 어떻게 처리해야 하는 값일까?
- 이상치의 존재위치, 분포
- “수집 과정에서” 오류가 개입하여 발생한 것으로 간주된다.
- 중앙값?
[추가] - 제2사분위수?
[추가] - 상자 수염 도표?의 상자높이?



(5번 문제가 5대5 어휘 문제인 것을 보고)
‘5번 문제는 그때그때 나오면 풀자.

========== 과학기술 08강이 풀리는 흐름 (하) ==========
※ ‘선 문제’하는 데 3분30초~4분30초가 걸렸다. 이제 지문 들어간다.

【1문단】
(ⓐ 부분 읽고)
- 5번 문제 ①번 선지 보통 크기 x.

(마지막 문장 ‘이상치와 결측치는 … 데이터 전처리 과정에서 잘 처리해 주어야 …’ 읽고)
- 풀이선상에 ‘이상치는 어느 시점에서 어떻게 처리해야 하는 값일까?’ 떠오르면서, 2번 문제 ①번 선지 다시 보고 ‘분석 전에’ 부분에 동그라미.

※ 1문단 내용 해설
- 데이터는 모든 것에 있고 계속 생겨난다.
- 이걸 잘 분석하면 유용한 지식·통찰력을 얻는다.
- 잘 분석하려면 이상치·결측치를 분석 전에 적절히 처리해야 한다.

【2문단】
(ⓑ 부분 읽고)
- 풀이선상에 ‘“수집 과정에서” 오류가 개입하여 발생한 것으로 간주된다.’가 떠올랐다. 2번 문제 ⑤번 선지랑 딱 맞아 떨어지는 문장이네. 크게 O.
- 그리고 ①번 선지도 ‘제거해야’에 동그라미 치면서 최종적으로 크게 O.
- 5번 문제 ②번 선지 크게 X.
※ 이런 게 ‘선 문제 후 지문’ 메타에서 희열을 느끼는 포인트이다.

(“… 중앙값이다.” 문장 읽고)
- 중앙값!! 3번 문제 ⑤번 선지였다. 체크하자.
5.900000
10.500000
10.900000
13.800000
14.100000
16.299999
16.400000
20.000000
23.500000
- 줄 세워 보니 이렇네? 중앙값은 14.100000이다. 크게 X.

(“중앙값을 제2사분위수라고도 한다.” 문장 읽고)
- 제2사분위수!! 4번 문제 ②번 선지였다. 체크하자.
- 줄 세워 보니 500이 딱 중앙값 맞네. 크게 O

(마지막 문장까지 읽고 나서)
- 1번 문제 해결되는 선지 없는지 한 번 둘러보러 갔다.
- ③,④번 선지에 보통 크기 x. 현재까지 읽은 바로는 제1~3사분위들 모두 평균이나 최댓값의 몇% 식으로 계산을 해서 내는 수치가 아니라, 순서로 따지는 개념이었다.
- ②번 선지 ‘분석 도중에’에 x 치면서, 이 선지를 보통 크기 x.
- ⑤번 선지 보통 크기 o.
- ①번 선지 하나 남았네? “결측치가 있으면 … 평균이 크게 달라지 수 있다.” 풀이선상에 올려 두자.

※ 2문단 내용 해설
- ‘이상치’는 정상 범위 밖에 있는 값이다.
- 이상치는 오류로 간주하여 분석 전에 제거한다.
- 이상치를 이해하기 위해(=정상 범위에 대해 이야기하기 위해) 사분위수 설명 들어간다.
- 제2사분위수: 전체 값들의 중앙값
- 제1사분위수: 제2사분위수보다 작은 값들의 중앙값
- 제3사분위수: 제2사분위수보다 큰 값들의 중앙값
- 중앙값: 순서대로 나열해놓고 셌을 때 중앙(50%)에 있는 값
- 중앙값 셀 때 크기가 같은 값들은? 하나하나 다 개수로 센다.
- 값 개수가 짝수면 중앙값이 딱 한 값으로 특정되지 않는데? 그 중앙에 있는 두 값의 평균으로 중앙값을 잡는다.

【3문단】
(첫 문장 읽고)
- 상자 수염 도표!! 4번 문제 생각나서 가 봤더니, 상자 높이 알아야 한다. 계속 읽자.

(“상자의 윗면이 제3사분위수를, 아랫면이 제1사분위수를 표시 …” 문장 읽고)
- 오우, 4번 문제 ⑤번 선지 계산 들어가자.
※ 단, 실전에서는 ⑤번 선지를 제쳐 두고 나머지 ①~④번 선지를 제대로 판단하겠다는 생각으로 접근해도 된다. 왜냐하면 과학기술 또는 경제 지문에서 이렇게 계산을 요하는 선지의 경우, 대개 시간을 많이 잡아먹었었다는 기억이 있을 테니까.
- 통화시간을 나열해 보니
1
2
3
4
5
6
7
14
50
- 제2사분위수 5.
- 제2사분위수보다 작은 숫자들은 1,2,3,4. 짝수네? 2와 3의 평균이 제1사분위수다. 2.5
- 제2사분위수보다 큰 숫자들도 짝수지?(6,7,14,50) 7과 14의 평균이 제3사분위수다. 10.5
- 따라서 상자 수염 도표의 높이는 8이다. ⑤번 선지 크게 O.

(…IQR를 이용하여 판단한다.…)
- 나왔다 IQR! 지금부터 내용은 더 집중해서 차근차근 읽어 보자.

(문단 마지막까지 읽고 나서)
- 4번 문제 ①, ③번 선지를 이제 풀어야 하는데, 나는 ③번 선지 먼저 봤다. 더 의심스러웠으므로. 180은 거의 중간이잖아. 이상치이기 힘들 것 같거든. 그리고 세 자릿수여서 더 셈이 성가실 것 같았다. 무엇보다 ⑤번 선지 하면서 [통화시간] 열의 IQR은 이미 구했으니까 ③번 선지 먼저.
- 허용 상한값은 (8 × 1.5) + 10.5 = 22.5
- 하용 상한값보다 큰 건 ‘50’ 1개네? 크게 X. 
⇒ 4번 문제 정답 ③
- 덤으로, 5번 문제 ③번 선지도 X.

※ 3문단 내용 해설
- 상자 수염 도표를 그려 보자.
- 우선 상자를 그려 보자. 제3사분위수를 윗면, 제1사분위수를 아랫면으로 하는 직사각형을 그린 후, 제2사분위수를 사각형 안에 가로 선으로 그으면 된다.
- 이어서 수염 끝을 표시해 보자. 제3사분위수에 IQR × 1.5(다른 값으로 구할 수도 있음)를 더한 지점이 위쪽 끝, 제1사분위수에 IQR × 1.5(다른 값으로 구할 수도 있음)를 뺀 지점이 아래쪽 끝이다.
- 그래프에서 수염 끝을 벗어난 값들이 이상치이다.

【4문단】
(들어가기 전에 2번 문제 한 번 털고 가기로 함)
- 2번 문제 ②번 선지 적절하고(O 표시), ③번 선지 아예 틀렸네.(X 표시)
⇒ 2번 문제 정답 ③

(첫 문장 읽고)
- 결측치, 평균!! 1번 문제 ①번 선지 x.
⇒ 1번 문제 정답 ⑤

(ⓓ 부분 읽고)
- 5번 문제 ④번 선지 O.
- 자, ⓔ만 x 나오면 5번 문제 정답은 ④다. ⓔ 1개만 남았으니 ⓔ를 지금 확인하고 싶으면 지금 바로 확인해도 되거든? 나는 바로 확인했다.
⇒ 5번 문제 정답 ④
- 그리고 ‘망실’이라는 단어가 낯이 익네? 3번 문제 ①번 선지 크게 X.

(마지막까지 다 읽고)
- 3번 문제 ②,③ 틀렸교(각각 X), ④번 선지만 적절하다(O)
⇒ 3번 문제 정답 ④ <끝>

여기까지 4분 더 걸려서 푸는 데 걸리 총 시간 8분 내외.

※ 4문단 내용 해설
- 결측치는 수치가 미상인(=알려지지 않은) 값이다. ‘NaN’으로 표시한다.
- [결측치 처리하는 방법 1. 삭제] 결측치가 있는 ‘행’ 또는 ‘열’삭제한다. 그 행이나 열의 다른 값들은 정상치일 수 있겠지? 그러네 그런 값들도 같이 날아가버리니까 망실이 발생한다.
- [결측치 처리하는 방법 2. 대체] NaN을 임의의 값으로 갈아 끼우는 것이다. 망실이 일어나진 않지만, 데이터 교란을 최소화할 수 있는 값으로 대체하는 것이 관건이다. 평균, 중앙값이 많이 사용되고 직전·직후 행 값 등도 쓰인다.


========== 마무리 멘트 ==========

교재 진도를 나간 첫 시간이었습니다. ‘선 문제 후 지문’ 메타 자체에 대해 한 번도 생각해보지 않았을 거라는 전제에서 차근차근 논리를 이어나가다 보니, 현장 교실수업에서는 지문을 살펴보는 (하) 부분을 제대로 끝마치지 못했었습니다. 우리 진도 나가는 지문들은 6월, 9월, 실제 수능에서 연계 가능성이 높은 것들만 추린 겁니다. 그리고 내신 시험 범위이기도 하지요. 지금 올린 이 자료를 통해 지문 내용 잘 복습하고, 수업 내용도 다시금 환기해 보기 바랍니다. 모두 파이팅!
나머지 수업 내용도 여러분 4일차 시험 끝나기 전까지 다 올려놓을 테니, 5일차 심화국어 내신시험 앞두고 꼭 살펴보면서 지문 공부하고 시험에 임하기 바랍니다. 최근 독감 확진을 비롯한 그동안의 각종 사정으로 인해 수업 자료 업로드가 계속 지연된 점 죄송합니다. 이번에는 밤을 새서라도 꼭 다 올려놓을게요. 모두 열공! - 이주영

+ Recent posts