본문 바로가기
승H정전/아주 짧은 생각

돈/시간이 많으면 하고 싶은 사회(?)과학 연구

by 승공돌이 2022. 5. 8.

산업경영공학과에 재학 중이다 보니 사회과학에 대한 연구를 자주 접하게 된다. 물론 현재 내가 수행 중인 분야와 큰 관련은 없지만 연구자로서 한 번쯤은 해보고 싶은 분야의 연구들이다 (주로 집중력이 떨어졌을 때 "recommeded for you"를 타고 가다 보면 이런 분야에 도착하게 된다). 구체적으로는 human behavior에 대한 연구에 관심이 많이 가는데, 사람이 특정 행동을 결정하게 되는 상황, 이유를 기발한 실험을 통해 분석하는 연구를 보면 연구자의 창의력에 감탄하고, 또 실험 과정에서 그들이 겪였을 노고에 박수를 보내고 싶다.

지금은 제대로 된 논문 하나 없는 박사과정 재학생이지만, 박사 학위를 받고 돈가 시간이 많은 연구자가 된다면 해보고 싶은 연구가 있다. 이것에 사회과학이라는 대단한 이름을 붙이는 게 맞는가 싶지만, 평소에 궁금했던 것들을 열거하고자 한다.

지도 플랫폼에 따른 긍정/부정 리뷰 경향에 대한 연구: 카카오와 네이버를 중심으로

나는 아재들이 좋아하는 밥/술집을 좋아하는 사람이다. 이럴 때 솔직한 리뷰를 보기 위해서 가장 좋은 지도 어플리케이션은 "구글 지도"이다. 리뷰어들의 아이디만 봐도 중년의 아저씨들이 사용하는 디폴트 값이고, 리뷰에도 그들의 심정으로 솔직한 감상이 적혀있다. 반면, 여자 친구와 데이트하기 위해 적합한 식당/카페를 찾기 위해서는 네이버 지도와 카카오 지도가 더 적합하다. 현재 트렌디한 곳이 어디인지, 젊은 사람들의 리뷰는 어떤지, 대표 키워드는 무엇인지 등을 더 상세하게 알려주기 때문이다.
두 지도 플랫폼을 사용하다 보면 같은 업체라고 하더라도 사용자의 리뷰가 극명하게 갈리는 곳이 있다. 경험에 의한 것이기에 통계를 내릴 수는 없지만, 네이버 지도에서의 리뷰가 카카오 지도에서의 리뷰보다 긍정적인 곳이 많았다. 리뷰 수가 적은 곳에서는 더 극명하게 드러나고, 리뷰 수가 많더라도 평점 자체가 네이버에서 더 높은 경우가 많다. 집 근처에 있는 유명한 해장국 집은 솔밭에 대한 평가를 예시로 들면 아래와 같다.


네이버 지도에서의 리뷰 결과
카카오 지도에서의 리뷰 결과



같은 업체라고 하더라도 평균 평점이 네이버 지도는 4.3 점이고 카카오 지도의 3.8 점으로 0.5 점의 차이가 있다. 5점 만점임을 고려하면 상당히 큰 차이라고 할 수 있다. 한번 다른 곳도 검색해보면 비슷한 결과가 나온다. 이러한 점수의 편향은 두 지도 플랫폼 사용자의 편향에 의해서 벌어진 것이 아닌가 예상해본다. 성별/연령과 같은 요소 외에도 키워드 분석 등을 통해서 어떤 요인이 네이버 지도에 더 긍정적인 리뷰가 많게, 혹은 카카오 지도에 더 부정적인 리뷰가 많아지도록 영향을 미쳤는지 알아보고 싶다.

답변하고 하는 Research Question은 무엇인가?
RQ1. 지도 플랫폼에 따른 사용자의 사회/ 인구통계학적 차이가 존재하는가?
RQ2. 지도 플랫폼에 따른 리뷰의 긍정/부정 평가에 대한 경향(편향)이 존재하는가?
RQ3. 만약 긍정/부정 평가에 대한 경향이 존재한다면 그 원인은 무엇인가?


빅 데이터 기반 사주, 궁합에 대한 분석

나는 사주나 팔자, 궁합 같은 것은 믿지 않는다. 사람이 언제 몇 시 몇 분에 태어났다는 이유로 미래가 (조금이라도) 결정된다는 게 말이 되나 싶다.  한편, 사주팔자를 믿는 사람들은 그것이 일종의 빅 데이터 분석이라고 주장한다. 구체적으로 데이터 기반으로 설명하는 것을 들은 적은 없지만, 아무래도 그들이 내세우는 가설은 이렇게 적을 수 있지 않을까?

H1. 사람이 출생 일시와 사람의 진로는 상관관계가 존재한다.
H2. 특정 사람의 쌍 (pair)가 존재할 때 쌍을 구성하는 사람의 출생 일시는 그들의 행복과 상관관계가 존재한다.

병원 정보 시스템의 발전으로 모든 사람이 언제 몇 시에 태어났는지를 탐색하는 것은 어려움이 없다. 또한 건강보험 정보만 조회해도 근로 소득자 대부분의 업종, 소득을 알아내는 것은 일도 아니다. 인적사항을 잘 masking 하고, 업종이나 소득에 대한 정보를 비식별화 한 데이터를 통해서 두 가설이 통계적으로 유의한 지 확인한다면 사주, 궁합 등에 대한 타당성을 확인할 수 있을 것이다. 물론 저 두 가설은 내가 생각한 너무나 간단한 것이기 때문에 사주, 궁합에 대한 전문가를 충분히 섭외하여 증명이 필요한 가설을 더 세워보는 것이 필요할 것이다.

이렇게 쓰고 나니까 대학교 1학년 시절 과학과 사회의 통합적 이해를 가르쳐주셨던 김기흥 교수님과 해당 주제를 바탕으로 토론했던 기억이 난다. 사주, 팔자나 포항공대생들이 하게 되는 실험이나 "귀납적 접근"인 것은 같다고, 과학과 미신을 구분 짓는 것이 무엇인지 자신을 설득해 보라는 내용이었다. 당시에는 실험 방법론이나 가설 검증에 대한 지식이 부족했지만, 지금은 조금 더 파 본다면 충분히 그 차이를 구분 지을 수 있지 않을까 생각한다.

사회 과학은 너무 어려운 것 같아

다 쓰고 나니 역시 사회 과학은, 특히 사람의 행동/감정을 분석하는 학문은 어려운 것 같다. 같은 사람이라도 그날의 날씨에 따라서 다른 리뷰를 할 수 있고, 성공/실패 혹은 부자/빈자에 대한 기준도 사람마다 다를 것이다. 그렇지만 이렇게  손에 잡히지 않는 무언가를 손에 잡을 수 있도록 만지작 거리고 분석하는 것은 언제 봐도 흥미로운 주제이다. 우선은 쉬운 문제부터 풀어보고 어려운 건 나중에 차차 여유롭게 해 보는 그런 성공한 공학자 승공이 되야겠다.



반응형

댓글