역학의 기초

이 장을 읽은 후 다음을 수행 할 수 있습니다:

  1. 혼란자와 효과 수정자 구분
  2. 계층화 분석을 수행하여 데이터에 효과 수정이 있는지 여부를 확인합니다.

이전 장에서 우리는 혼란에 대해 논의했습니다. 혼동하는 사람은 적절하게 통제되지 않으면 편향된 협회 추정치로 이어지는 세 번째 변수입니다. 효과 수정은 또한 세 번째 변수(노출이 아니라 결과)를 포함하지만,이 경우 우리는 절대적으로 그것을 통제하고 싶지 않습니다. 오히려 효과 수정의 존재 자체가 흥미로운 발견이며,우리는 그것을 강조합니다.

효과 수정(상호 작용이라고도 함)이 있으면 세 번째 변수(공변수라고도 함)의 다른 수준에 대해 다른 결과가 나타납니다. 예를 들어,한 학기 동안 오레곤 주립 대학 학생들의 수면량과 평점에 대한 코호트 연구를 수행하면 이러한 데이터를 수집 할 수 있습니다:

표 8-1
평점
< 3.0 ≥ 3.0
수면 양 < 8 시간 25 25
> 8 시간 25 25

이 연구는 코호트 연구 였기 때문에 위험 비율을 계산합니다.:

{25}{50}} = 1.0

수면의 양과 이후의 평점 사이에는 연관성이 없습니다.

1 박당 평균 8 시간 미만의 수면을 취한 학생들은 1 박당 최소 8 시간을 얻은 학생들에 비해 평점이 3.0 미만인 학기가 끝날 확률이 1.0 배 높았다.

이것은 코호트 연구의 위험 비율이므로 시간 프레임을 포함해야합니다. 다만 혼동하기에 관해서는,우리는 이것을 조정되지 않는 조잡한 루트로 가리킨다.

그러나 학생들과 이야기하는 것에서 우리는 성별이 중요한 공변수인지 아닌지 궁금해합니다. 혼란과 마찬가지로,우리는 효과 수정을 확인하기 위해 계층화 된 분석을 수행 할 것입니다. 다시 말하지만,우리는 동일한 노출(수면)과 결과(평점)를 가진 2 개의 2 개의 테이블을 그리지 만 남성과 여성을위한 별도의 테이블을 그립니다(성별은 공변량 임). 우리는 원시 데이터를 되돌아보고 위의 세포에있는 25 명 중 얼마나 많은 사람들이 남성이고 얼마나 많은 사람들이 여성인지 파악하여이를 수행합니다. <8 시간을보고하고 평점<3 을 가진 25 명의 사람들 중 그것을 가정 해 봅시다.0 명,11 명은 남성,14 명은 여성이었다. 그런 다음 유사하게 참가자를 비,씨,및 디 세포,그리고 지층 별 2 엑스 2 테이블:

표 8-2
남자 평점
< 3.0 ≥ 3.0
수면 양 < 8 시간 11 14
8+ 시간 17 9
표 8-3
여성 평점
< 3.0 ≥ 3.0
수면 양 < 8 시간 14 11
8+ 시간 8 16
위의 2 개의 2 개의 표의 데이터를 사용하여,지층별 루핑은 다음과 같다:

다음 예제는 다음과 같습니다.{11}{25})}{(\프랙{17}{26})} = 0.68

나는 그것을 좋아한다.{14}{25})}{(\프랙{8}{24})} = 1.7

해석:

남학생 중 1 박당 8 시간 미만의 수면을 취한 사람들은 평점<3 을 가질 위험이 0.68 배 높았다.8 시간 이상 보고한 사람들과 비교된 기간의 끝에 0.

여학생들 중 1 박당 8 시간 미만의 수면을 취한 사람들은 8 시간 이상보고 한 사람들에 비해 임기가 끝날 때 평점<3.0 을 가질 위험이 1.7 배 높았다.

8 시간 미만의 수면을 취하는 것은—이 가상의 데이터에서—남학생 중 더 높은 평점과 관련이 있습니다(“결과”는 낮은 평점을 나타내므로 1 보다 적 으면 노출 된 개인이 낮은 평점을 가질 가능성이 적음을 나타냅니다).

이 경우 성별은 효과 수정 자 역할을합니다:수면과 평점 간의 연관성은 공변량의 지층에 따라 다릅니다. 다음 주어진 계층화 분석을 수행 할 때 효과 수정을 발견 할 수 있습니다:

  • 연관의 지층별 측정값이 서로 다르다
  • 그 사이에 있는 원유

효과 수정이 있는 경우 다음 단계는 지층별 측정값을 보고하는 것이다. 우리는 조정 된 측정 값을 계산하지 않습니다(그것은 원유와 비슷한 1.0 근처에있을 것입니다); 여기서 흥미로운 것은 남성과 여성이 다르게 잠에 반응한다는 것입니다. 효과 수정은 우리가 우리의 결과에서 강조하고 싶은 무언가이다,멀리 조정되지 뭔가.

혼란과는 달리,어디 10%조정 원유에서 변화는 혼란에 대한 허용 정의입니다,지층 별 측정 뭔가 효과 수정을 호출 할 수 있어야합니다 얼마나 다른에 대한 이러한 표준화 된 정의가 존재하지. 효과 수정자를 선언하면 공변수의 각 수준에 대해 결과를 별도로 보고해야 합니다. 따라서 역학에서 우리는 문헌에보고 된 효과 수정의 증거를 거의 볼 수 없습니다. 긴 이야기 짧은,효과 수정을위한 충분한”다른”은”명백하게 다릅니다.”

기사를 읽을 때 효과 수정은 때때로 상호 작용이라고 부르거나 저자는 계층화 된 분석을보고하고 있다고 말할 수 있습니다. 이 3 개의 문구 중 하나는 효과 수정 자 역할을하는 변수가 있다는 단서입니다.

효과 수정 예 2

2008 년 주택 거품 중심의 경기 침체(이 노출이다)에 따라,미국 경제는 많은 일자리를 잃었다. 다음은 경기 침체 전,도중 및 후에 작업 한 사람 수(결과)를 보여주는 그래프입니다. 결과는 성별(공변수)에 의해 계층화되어 표시되므로 분석가는 성별이 효과 수정 자로 작용할 수 있다고 의심했습니다. 실제로 결과는 약간 다릅니다:남성(파란색)은 더 많은 일자리를 잃었고 2014 년 현재 아직 경기 침체 이전 수준으로 회복되지 않은 반면 여성(빨간색)은 더 적은 일자리를 잃었고 2014 년에는 완전히 회복되었습니다.

그림 8-1
출처: https://fred.stlouisfed.org/graph/fredgraph.png?g=qUs

우리가 또한 나이에 따라 계층화한다면 어떨까요? 첫째,여기에 경기 침체 사람들이 55 세 이상에 대한 작업에 영향을 미치는 방법을 보여주는 그래프입니다:

그림 8-2
출처: https://fred.stlouisfed.org/graph/fredgraph.png?g=qUt

경기 침체는 전혀 이전 작업 미국인에 영향을 미치지 않았다. 도 아니다 우리는 성별로 효과 수정을보고-2 라인은 거의 평행.

젊은 성인은 어떻습니까?

그림 8-3
출처: https://fred.stlouisfed.org/graph/fredgraph.png?g=qUv

여기에서 우리는 성별로 주요 효과 수정이-젊은 남자는 가능한 작업의 거대한 비율을 잃고 완전히 회복되지 않았다 2014. 경기 침체가 주택 거품에 의해 크게 발생했기 때문에 이것은 놀라운 일이 아니다,건설 노동자는 대부분 젊은 남성이다. 대조적으로,젊은 여성들은 일자리의 작은 비율을 잃어 버렸고 빠르게 사전보다 더 나은 수준으로 회복되었습니다.

마지막으로,우리는 25~54 세의 일자리를 살펴 봅니다.:

그림 8-4
출처: https://fred.stlouisfed.org/graph/?id=LNS12000061

여기서 우리는 매우 황량한 그림을 봅니다. 이 연령대에서 일자리는 여성보다 남성에게 더 많이 손실되었으며 2014 년 현재 전혀 회복되지 않았습니다.

따라서 2008 년 경기 침체에 대한 고용 시장의 반응을 조사 할 때,우리는 연령에 따른 실질적인 효과 수정(일자리 회복은 연령에 따라 크게 달라짐)과 일부 연령 범주 내에서 성별에 따른 효과 수정의 증거를 볼 수 있습니다. 일자리에 대한 경기 침체의 영향은 연령과 성별이 다른 사람들에게는 달랐습니다.

이것은 정책의 영향이 매우 다를 수 있기 때문에 중요합니다. 연방 정부의 일원으로 일하면서 경기 부양책이나 복구 패키지를 설계하려고한다고 상상해보십시오. 연령분석이 없는 첫 번째 그래프에서 가져온 데이터만 있는 경우 연령별 계층화 분석에 액세스할 수 있는 경우와 잠재적인 정책 솔루션이 매우 다를 수 있습니다.

혼동을 사용하면 혼동이 그룹 사이에 균등하게 분배되지 않기 때문에 처음에는 잘못된 대답을 얻습니다. 이것은 당신이 계산하는 협회의 측정을 왜곡(기억:더 큰 발을 갖는 것은 단지 때문에 학년 수준에 의해 혼란의 읽기 속도와 연결되어). 그래서 대신 당신은 협회의 측정을 다시 계산해야,이 시간은 혼자를 조정.

효과 수정을 통해 처음에는 잘못된 답을 얻었지만 이번에는 샘플에 노출/질병 연관성이 다른 2 개 이상의 하위 그룹이 포함되어 있기 때문입니다. 이 경우 각 계층에 대해 이러한 하위 그룹을 영구적으로 분리하고 결과(다른 공변량에 의해 혼동 될 수도 있고 혼동되지 않을 수도 있음)를 별도로 보고해야합니다: 이 경우,적은 수면을 취하는 남성은 더 많은 수면을 취하는 남성보다 더 높은 수면을 취하지 만,동시에 더 많은 수면을 취하는 여성은 적은 수면을 취하는 여성보다 더 높은 수면을 취합니다.

다음은 잠재적 혼란 자 및 효과 수정자를 다루는 프로세스를 나타내는 요약 표입니다. 이 과정의 대부분은 당신이 가지고있는 공변량의 유형에 관계없이 동일합니다(모든 경우에,당신은 당신의 연구 중에 공변량을 측정하고 잘 측정해야합니다!). 차이의 영역은 빨간색으로 표시됩니다.

표 8-4
혼동 효과 수정
연구를 계획하기 전에 연구중인 노출/질병 과정에 대해 알고있는 것을 기반으로 어떤 변수가 혼란 스러울 수 있는지 생각해보십시오. 연구중인 노출/질병 과정에 대해 알고있는 것을 기반으로 어떤 변수가 효과 수정 자로 작용할 수 있는지 생각해보십시오.
연구 중 잠재적 공변량에 대한 데이터 수집-층화/조정 된 분석은 공변량에 대한 데이터 없이는 수행 할 수 없습니다! 잠재적 공변량에 대한 데이터 수집-층화/조정 분석은 공변량에 대한 데이터 없이는 수행 할 수 없습니다!
분석:1 단계 연관성의 원유 측정 값을 계산합니다(공변량 무시). 연관성의 원유 측정 값을 계산합니다(공변량 무시).
분석: 2 단계 공변수의 각 수준에 자체 2 엑스 2 표가 있도록 연관 지층별 측정값을 계산합니다. 공변수의 각 수준에 자체 2 엑스 2 표가 있도록 연관 지층별 측정값을 계산합니다.
분석:3 단계 지층별 측정값이 서로 유사하고 원유(이들 사이에 속하지 않음)와 10%이상 다른 경우,공변량은 혼자입니다. 지층별 측정값이 서로 다르고 원유가 그 사이에 있으면 공변수는 효과 수정자입니다.
쓰기 결과 컨펀더에 대해 제어하는 조정된 연관 측정값을 보고합니다. 는 협회의 지층 특정한 측정을 보고합니다.

노인의 신체 활동 및 치매에 대한 횡단면 연구를 수행하고 조정되지 않은 확률 비율(또는)을 2.0 으로 계산한다고 상상해보십시오. 당신은 결혼 상태가 중요한 공변 수 있다고 생각,그래서 당신은”현재 결혼”대”현재 결혼하지”에 의해 계층화(이는 결혼하지 포함,이혼,과부). 현재 결혼 한 사람들 중 또는 3.1 이며,현재 결혼하지 않은 사람들 중 또는 3.24 입니다. 이 경우,결혼 상태는 혼자의 역할을하고,우리는 조정 또는보고 것(이는 3.18 정도 될 것이다).

당신이 임신 한 여성의 조산을 방지하기 위해 지중해 다이어트의 무작위 시험을 할 것을 상상해보십시오. 당신은 시험을하고 0.90 의 루피를 계산합니다. 당신은 아마도 패리티가 중요한 공변 수 있다고 생각하므로 계층화 된 분석을 수행합니다. 이 경우,이 경우,항체 및 항체 중 어느 것이 가장 좋은지 알 수 있습니다. 이들은 서로 다른,그리고 원유 그들 사이에 거짓말. 이 경우 패리티는 효과 수정자 역할을 하므로 2 개의 지층별 루페이 값을 별도로 보고할 수 있습니다.

당신이 흑색종과 이전 무두질 침대 사용의 케이스 통제 학문을 하고 있다는 것을 상상하십시오. 원유 또는 3.5 이지만,아마도 성별은 중요한 공변량입니다. 계층화 된 분석은 남성 중 3.45 명,여성 중 3.56 명을 산출합니다. 이 경우 공변수(성별)는 혼동자도 효과 수정자도 아닙니다. 우리는(1)원유가 2 개의 지층 별 추정치 사이에 있기 때문에 혼자가 아니라고 말하지만,또한(2)지층 별 추정치는 원유와 10%이상 다르지 않습니다. 우리는 3.45 와 3.56 이 그렇게 다르지 않기 때문에 효과 수정자가 아니라고 말합니다—두 경우 모두 상당한 효과(약 3.5 배 높음)가 있습니다. 우리는 성별의 영향을 설명하기 위해 조정이나 계층화가 필요 없기 때문에 협회의 조잡한 추정치를보고 할 것입니다.

네! 일반적으로 우리는 문제의 공변수가 효과 수정을 확인하기 위해 이분법화 된 연속 변수 일 때 이것을 봅니다. 예를 들어,나이가 효과 수정 자일 수 있다고 생각하면 샘플을 계층화 분석을 위해”오래된”및”젊은”으로 나눌 수 있습니다(예:50 세 이상 대 50 세 이하). 51 세 70 세처럼되지 않는 정도,우리는 결과에 몇 가지 중요한 뉘앙스를 놓칠 수 있습니다,더 많은 범주와 데이터 추가 효과 수정이 존재 가능성이 있기 때문에(이는 거의 아무것도에 전원을 떨어 뜨릴 것,했다 우리는 추가 계층에 대해 별도로보고)또는 이전 장에서 논의 된 바와 같이”잔류”혼란. 더 자세한 내용은이 책의 범위를 벗어나지 만,동일한 공변량이 이론적으로 혼동 자 및 효과 수정 자로 작용할 수 있지만 실제로는 거의 볼 수 없다는 것을 알고 있습니다.

결론

우리가 분석에서 없애고자 하는 혼란과 달리,효과 수정은 그 자체로 흥미로운 발견이며,우리는 그것을 보고한다. 효과 수정을 확인하려면 층화 분석을 수행하십시오. 지층별 연관 측정값이 서로 다르고 그 사이에 원유가 놓여 있다면 해당 변수가 효과 수정자 역할을 할 가능성이 높습니다. 공변량의 각 계층에 대해 결과를 따로보고하십시오.

하나의 최종,모두 함께 테이블:

표 8-5
만약 이것이 당신의:
원유/조정되지 않은 지층 지층 그런 다음 공변량은…
2.0 1.0 3.2 효과 수정자 2 계층별 연관 측정값
2.0 3.5 3.6 컨핀더 조정된 측정값
2.0 1.9 2.0 아무것도 흥미로운 원유 측정

노출-질병 관계를 방해하는 세 번째 변수에 의해 발생하는 연구(일부 사람들은 편견이라고 부릅니다.

노출과 결과 간의 관계가 세 번째 변수에 따라 달라질 때 시나리오를 나타냅니다. 예를 들면,아마 요가는 여성 그러나 아니다 남성안에 관절낭 부상을 방지한다. 이 시나리오에서 섹스는 효과 수정 자입니다. 효과 수정은 혼란과 동일하지 않습니다.

당신의 연구가 거기에있는 것을 발견 할 확률. 베타는 2 형 오류율입니다. 소규모 연구 또는 드문 사건에 대한 연구는 일반적으로 전원이 부족합니다.

한 여성이 얼마나 많은 자녀를 낳았습니까? 미산 여성(일명 미산)은 아직 첫 아이를 낳지 않았으며(임신했을 수도 있지만 아직 아이를 낳지 않았습니다),임신 한 여성은 적어도 한 명의 이전 아이를 낳았습니다. 다중 파라에는 적어도 2 명의 이전 아이가 있었다;초기 파라에는 1 명의 이전 아이가 있었다.

이것은 여성의 첫 번째 임신입니다.

이 여자는 다른 아이를 낳았습니다.