일단 본인은 네트워크 이론을 공부를 안했고, graph 이론도 공부를 안했고
컴퓨터 공학도 전공을 하지 않은 관계로 이리저리 구글링을 하면서 내 나름대로의 계획을 짜고 일을 하기 시작한다.
동기 : 시사 글들을 보면 한번씩 정치경제계의 복잡한 혼맥을 보게 되는데 제대로 한번 정리해보고 혼자 할게 아니라 여러사람이 함께 할일이라 생각되어 db를 만들면 어떨까 하는 생각이 들었음. DB 이야기가 들어갈 거라 프로그래밍 게시판에 글을 씀.
먼저 위키피디아를 살펴보면 다음과 같이 네트워크 과학을 정의한다.
https://ko.wikipedia.org/wiki/%EB%84%A4%ED%8A%B8%EC%9B%8C%ED%81%AC_%EA%B3%BC%ED%95%99 >>>
네트워크 과학( - 科學, 영어: network science)은 네트워크는 점(vertex, node)과 연결선(edge, link)들로 이루어진 집합을 의미한다. 특히 연결선들이 들어오고 나오는 방향이 있는 경우 방향성 네트워크라고 하고, 각 연결선들에 가중치가 부여된 경우 가중치 네트워크라고 한다. '네트워크 이론'은 응용수학과 물리학 분야에서 다루는 이론으로, 수학의 그래프 이론에서 비롯하였다. 현재 전산학, 생물학, 경제학, 사회학 분야에 널리 적용된다. 네트워크 이론의 모태인 그래프 이론은 꼭짓점과 그 꼭짓점을 잇는 변으로 이루어진 그래프를 수학적으로 연구하는 이론으로, 수학과 전산학 분야에서 널리 연구되었다. 월드와이드웹, 인터넷, 단백질 상호작용 네트워크, 사회 네트워크 등이 일정한 성질을 가지는 복잡계 네트워크를 이룬다는 사실이 알려진 이후로, 물리학, 생물학, 경제학, 사회학 등 여러 분야에 복잡계 네트워크 이론이 활발히 적용되고 있다[1]. >>> 저 1번 참조는 정하웅, 강병남 교수 책인데 이 두분은 요 분야에서 권위 있는 분들이다. (학회가면 이 그룹 발표가 상당함.)
여기서부터 내가 일할 방향을 말하도록 하겠다.
Node(점)는 경제인, 정치인, 언론인, 연예인, 유명 범죄자 등, 유명인과 권력자로 한다.
Link(선)는 부모, 형제, 자매 등 혈맥과 부부, 사돈 등 혼맥을 기본으로 강한 관계를 설정하고,
지연, 학연 등을 포함하도록 설계한다.
DB를 만들기 위한 계획
Node Table 설계 :
id(unique, int), type_id(int), Name(string), Description(string)
( 1 1 이재용 삼성 재벌의 사실상 총수하고 네이버 인물검색 링크 이런식... )
을 기본으로 영향력 등을 쓰고 싶으나 객관적 데이터가 없어서 모르겠음... 추가할 내용이 있으면 댓글로 알려주시길
Type Table 설계
id(unique, int), {prototype_id(int)}, Name(string)
1 1 재벌총수
prototype은 만약 type을 대기업 총수, 등으로 분리를 하게 되었을 때, 경제인 언론인 등으로 분류를 할 때 필요 할 것 같음.
Prototype 설계
id(unique, int), Name(string)
1 경제인
2 정치인
Link Table 설계(일단 link를 양방향으로 할 지 결정을 안하였음.)
id(unique,int), node1_id(int), node2_id(int), relation<link>_id(int), strength(int)
1 박정희 박근혜 1 100
Relation Table 설계
id(unique,int), prototype_link_id, Name
1 1 부모자식(혈맥 1대)
10 1 친척 (방계)
Prototype Link Table 설계
id(unique,int), Name(string)
1 혈맥
일단 위와 같은 방식으로 계획을 하고 있습니다.
google drive에 office 왠만한 것들 다있길래 db도 있을 줄 알았는데 없네요...
스프레드쉬트에다가 만들어놓고 긁어서 DB에다가 넣는 식으로 작업을 해야할 것 같습니다.
제가 아주 초보수준의 DB책만 읽어봐서 설계를 제대로 하고 있는지 잘 모르겠습니다.
SQL 고수님들께서 많은 조언을 해주시면 감사하겠습니다.