diff --git a/research/knowledge_graph/README.md b/research/knowledge_graph/README.md new file mode 100644 index 0000000..36a1d9f --- /dev/null +++ b/research/knowledge_graph/README.md @@ -0,0 +1,18 @@ +# 지식 그래프 구축 관련 핵심 논문 (2025-10-13 리서치) + +텍스트에서 구조화된 지식을 추출하여 지식 그래프를 구축하는 주제와 관련된 핵심 논문 10개의 요약입니다. + +각 논문은 `papers` 폴더 안에 개별 파일로 저장되어 있습니다. + +## 논문 목록 + +1. [Knowledge Vault: A Web-Scale Approach to Probabilistic Knowledge Fusion (2014)](./papers/2014_dong_knowledge_vault.md) +2. [Distant supervision for relation extraction without labeled data (2009)](./papers/2009_mintz_distant_supervision.md) +3. [Abstract Meaning Representation for Sembanking (2013)](./papers/2013_banarescu_amr_for_sembanking.md) +4. [Universal Dependencies v1: A Multilingual Treebank Collection (2016)](./papers/2016_nivre_universal_dependencies_v1.md) +5. [Knowledge Graphs (2021)](./papers/2021_hogan_knowledge_graphs_survey.md) +6. [Open Information Extraction from the Web (2007)](./papers/2007_banko_open_ie_from_web.md) +7. [Neural Architectures for Named Entity Recognition (2016)](./papers/2016_lample_neural_ner.md) +8. [Entity-Relation Extraction as Multi-turn Question Answering (2019)](./papers/2019_li_er_as_qa.md) +9. [A Survey on Knowledge Graphs: Representation, Acquisition and Applications (2020)](./papers/2020_ji_kg_survey.md) +10. [Unifying Large Language Models and Knowledge Graphs: A Roadmap (2023)](./papers/2023_pan_unifying_llms_and_kgs.md) diff --git a/research/knowledge_graph/papers/2007_banko_open_ie_from_web.md b/research/knowledge_graph/papers/2007_banko_open_ie_from_web.md new file mode 100644 index 0000000..2237ab0 --- /dev/null +++ b/research/knowledge_graph/papers/2007_banko_open_ie_from_web.md @@ -0,0 +1,10 @@ +--- +tags: [knowledge-graph, kgc, research-paper, open-information-extraction, oie] +date: 2025-10-13 +modification_date: 2025-10-13 +--- +# Open Information Extraction from the Web (2007) + +* **저자:** Michele Banko, Michael J. Cafarella, et al. +* **요약:** 'Open Information Extraction(Open IE)'라는 개념을 처음 제안한 논문입니다. 미리 관계(relation)의 종류를 정의하지 않고, 텍스트에서 <주어, 관계 서술어, 목적어> 형태의 튜플을 자동으로 추출하는 방법을 다룹니다. 예를 들어 "아인슈타인은 상대성 이론을 제안했다"에서 <아인슈타인, 제안했다, 상대성 이론>을 뽑아냅니다. 이는 스키마에 얽매이지 않고 웹의 방대한 텍스트에서 지식을 추출하는 연구의 시작점이 되었습니다. +* **링크:** [https://homes.cs.washington.edu/~etzioni/papers/ijcai07.pdf](https://homes.cs.washington.edu/~etzioni/papers/ijcai07.pdf) diff --git a/research/knowledge_graph/papers/2009_mintz_distant_supervision.md b/research/knowledge_graph/papers/2009_mintz_distant_supervision.md new file mode 100644 index 0000000..3847633 --- /dev/null +++ b/research/knowledge_graph/papers/2009_mintz_distant_supervision.md @@ -0,0 +1,10 @@ +--- +tags: [knowledge-graph, kgc, research-paper, relation-extraction, distant-supervision] +date: 2025-10-13 +modification_date: 2025-10-13 +--- +# Distant supervision for relation extraction without labeled data (2009) + +* **저자:** Mike Mintz, Steven Bills, et al. +* **요약:** 관계 추출(Relation Extraction) 모델을 학습시키기 위한 레이블링된 데이터가 부족한 문제를 해결하는 'Distant Supervision(원격 감독)' 방법론을 제안한 기념비적인 논문입니다. 기존 지식 베이스(e.g., Freebase)에 존재하는 사실(e.g., <스티브 잡스, 창업자, 애플>)을 활용하여, 이 두 개체(스티브 잡스, 애플)가 함께 등장하는 모든 문장이 해당 관계('창업자')를 나타낼 것이라고 '가정'하고 대량의 학습 데이터를 자동으로 생성합니다. 이 방법론은 대규모 관계 추출의 길을 열었습니다. +* **링크:** [https://aclanthology.org/P09-1113.pdf](https://aclanthology.org/P09-1113.pdf) diff --git a/research/knowledge_graph/papers/2013_banarescu_amr_for_sembanking.md b/research/knowledge_graph/papers/2013_banarescu_amr_for_sembanking.md new file mode 100644 index 0000000..07a30d2 --- /dev/null +++ b/research/knowledge_graph/papers/2013_banarescu_amr_for_sembanking.md @@ -0,0 +1,10 @@ +--- +tags: [knowledge-graph, kgc, research-paper, semantics, amr] +date: 2025-10-13 +modification_date: 2025-10-13 +--- +# Abstract Meaning Representation for Sembanking (2013) + +* **저자:** Laura Banarescu, Claire Bonial, et al. +* **요약:** 이전 대화에서 언급된 AMR(추상적 의미 표현)의 개념을 제안한 원 논문입니다. 문장의 표면적인 구조가 아닌, "누가 무엇을 누구에게 했는가"와 같은 핵심 의미를 비순환 방향 그래프(DAG)로 표현하는 방법을 제안합니다. 예를 들어 "소년이 소녀를 때렸다"와 "소녀가 소년에게 맞았다"는 다른 문장이지만 AMR 그래프는 거의 동일하게 표현됩니다. 이는 문장의 의미를 정규화하여 저장하는 데 핵심적인 아이디어를 제공합니다. +* **링크:** [https://aclanthology.org/W13-2322.pdf](https://aclanthology.org/W13-2322.pdf) diff --git a/research/knowledge_graph/papers/2014_dong_knowledge_vault.md b/research/knowledge_graph/papers/2014_dong_knowledge_vault.md new file mode 100644 index 0000000..f740f01 --- /dev/null +++ b/research/knowledge_graph/papers/2014_dong_knowledge_vault.md @@ -0,0 +1,10 @@ +--- +tags: [knowledge-graph, kgc, research-paper, probabilistic-fusion, google] +date: 2025-10-13 +modification_date: 2025-10-13 +--- +# Knowledge Vault: A Web-Scale Approach to Probabilistic Knowledge Fusion (2014) + +* **저자:** Xin Luna Dong, Evgeniy Gabrilovich, et al. (Google) +* **요약:** 구글 연구진이 발표한 논문으로, 웹 전체에서 자동으로 지식 베이스(Knowledge Base)를 구축하는 'Knowledge Vault' 프로젝트를 설명합니다. 기존의 지식 베이스(Freebase 등)와 웹 텍스트에서 추출한 정보를 확률적으로 결합하여, 정보의 신뢰도를 점수화하고 지속적으로 확장하는 방법을 제안합니다. 이는 '근거'와 '확실성'을 관리하며 대규모 지식 그래프를 구축하는 빅테크의 접근법을 가장 잘 보여주는 사례 중 하나입니다. +* **링크:** [https://dl.acm.org/doi/pdf/10.1145/2623330.2623623](https://dl.acm.org/doi/pdf/10.1145/2623330.2623623) diff --git a/research/knowledge_graph/papers/2016_lample_neural_ner.md b/research/knowledge_graph/papers/2016_lample_neural_ner.md new file mode 100644 index 0000000..458e985 --- /dev/null +++ b/research/knowledge_graph/papers/2016_lample_neural_ner.md @@ -0,0 +1,10 @@ +--- +tags: [knowledge-graph, kgc, research-paper, named-entity-recognition, ner, bilstm-crf] +date: 2025-10-13 +modification_date: 2025-10-13 +--- +# Neural Architectures for Named Entity Recognition (2016) + +* **저자:** Guillaume Lample, Miguel Ballesteros, et al. +* **요약:** 지식 그래프의 기본 노드(node)가 되는 개체명(Named Entity)을 인식하는(NER) 방법에 대한 대표적인 딥러닝 논문입니다. BiLSTM-CRF라는 신경망 아키텍처를 제안하여, 단어의 전후 문맥을 효과적으로 학습하고 개체명의 경계를 정확하게 찾아내는 데 큰 성능 향상을 이루었습니다. 현대적인 NER 모델의 기초가 되는 구조를 제시했습니다. +* **링크:** [https://arxiv.org/pdf/1603.01360.pdf](https://arxiv.org/pdf/1603.01360.pdf) diff --git a/research/knowledge_graph/papers/2016_nivre_universal_dependencies_v1.md b/research/knowledge_graph/papers/2016_nivre_universal_dependencies_v1.md new file mode 100644 index 0000000..d0aa620 --- /dev/null +++ b/research/knowledge_graph/papers/2016_nivre_universal_dependencies_v1.md @@ -0,0 +1,10 @@ +--- +tags: [knowledge-graph, kgc, research-paper, syntax, universal-dependencies] +date: 2025-10-13 +modification_date: 2025-10-13 +--- +# Universal Dependencies v1: A Multilingual Treebank Collection (2016) + +* **저자:** Joakim Nivre, Marie-Catherine de Marneffe, et al. +* **요약:** 이전 대화에서 언급된 Universal Dependencies(UD)의 v1을 소개한 논문입니다. 전 세계 여러 언어에 걸쳐 일관된 기준의 문법 구조(의존 관계) 주석을 단 '트리뱅크'를 구축한 프로젝트를 설명합니다. 주어, 목적어, 수식어 등 문장 성분 간의 관계를 표준화함으로써, 어떤 언어의 텍스트라도 일관된 방식으로 구문 분석하고 구조를 이해하는 기반을 마련했습니다. +* **링크:** [https://aclanthology.org/L16-1090.pdf](https://aclanthology.org/L16-1090.pdf) diff --git a/research/knowledge_graph/papers/2019_li_er_as_qa.md b/research/knowledge_graph/papers/2019_li_er_as_qa.md new file mode 100644 index 0000000..fc35511 --- /dev/null +++ b/research/knowledge_graph/papers/2019_li_er_as_qa.md @@ -0,0 +1,10 @@ +--- +tags: [knowledge-graph, kgc, research-paper, relation-extraction, question-answering] +date: 2025-10-13 +modification_date: 2025-10-13 +--- +# Entity-Relation Extraction as Multi-turn Question Answering (2019) + +* **저자:** Xiaoya Li, Fan Yin, et al. +* **요약:** 개체와 관계 추출 문제를 '질의응답(Question Answering)' 문제로 재정의한 독창적인 접근법을 제시합니다. 예를 들어, 주어진 문장에서 '창업자' 관계를 찾기 위해 "누가 무엇의 창업자인가?"와 같은 질문을 던지고, 문장에서 그 답을 찾는 방식으로 관계를 추출합니다. 이는 복잡한 관계를 보다 직관적인 방식으로 추출할 수 있는 가능성을 열었습니다. +* **링크:** [https://aclanthology.org/P19-1129.pdf](https://aclanthology.org/P19-1129.pdf) diff --git a/research/knowledge_graph/papers/2020_ji_kg_survey.md b/research/knowledge_graph/papers/2020_ji_kg_survey.md new file mode 100644 index 0000000..55cafdf --- /dev/null +++ b/research/knowledge_graph/papers/2020_ji_kg_survey.md @@ -0,0 +1,10 @@ +--- +tags: [knowledge-graph, kgc, research-paper, survey, representation-learning, embedding] +date: 2025-10-13 +modification_date: 2025-10-13 +--- +# A Survey on Knowledge Graphs: Representation, Acquisition and Applications (2020) + +* **저자:** Shaoxiong Ji, Shirui Pan, et al. +* **요약:** 지식 그래프의 표현 학습(Representation Learning), 구축(Acquisition), 그리고 응용(Applications)에 초점을 맞춘 또 다른 중요한 서베이 논문입니다. 특히 지식 그래프를 벡터 공간에 임베딩하여(TransE, TransH 등) 링크 예측이나 추론에 활용하는 '지식 그래프 임베딩' 기술들을 체계적으로 정리하여, 지식의 정량적, 통계적 처리에 대한 깊은 이해를 돕습니다. +* **링크:** [https://arxiv.org/pdf/2002.00388.pdf](https://arxiv.org/pdf/2002.00388.pdf) diff --git a/research/knowledge_graph/papers/2021_hogan_knowledge_graphs_survey.md b/research/knowledge_graph/papers/2021_hogan_knowledge_graphs_survey.md new file mode 100644 index 0000000..7955796 --- /dev/null +++ b/research/knowledge_graph/papers/2021_hogan_knowledge_graphs_survey.md @@ -0,0 +1,10 @@ +--- +tags: [knowledge-graph, kgc, research-paper, survey] +date: 2025-10-13 +modification_date: 2025-10-13 +--- +# Knowledge Graphs (2021) + +* **저자:** Aidan Hogan, Eva Blomqvist, et al. +* **요약:** 지식 그래프 분야의 거의 모든 것을 망라하는 방대한 서베이(Survey) 논문입니다. 지식 그래프의 역사, 데이터 모델(RDF, Property Graph), 온톨로지 및 스키마, 구축 방법(텍스트, 데이터베이스 등), 정제 및 완성, 저장 및 쿼리, 그리고 활용 분야까지 상세히 다룹니다. 지식 그래프 분야의 전체적인 그림을 이해하는 데 가장 좋은 교과서 같은 자료입니다. +* **링크:** [https://arxiv.org/pdf/2003.02320.pdf](https://arxiv.org/pdf/2003.02320.pdf) diff --git a/research/knowledge_graph/papers/2023_pan_unifying_llms_and_kgs.md b/research/knowledge_graph/papers/2023_pan_unifying_llms_and_kgs.md new file mode 100644 index 0000000..ae9f1c9 --- /dev/null +++ b/research/knowledge_graph/papers/2023_pan_unifying_llms_and_kgs.md @@ -0,0 +1,10 @@ +--- +tags: [knowledge-graph, kgc, research-paper, large-language-models, llm, survey, roadmap] +date: 2025-10-13 +modification_date: 2025-10-13 +--- +# Unifying Large Language Models and Knowledge Graphs: A Roadmap (2023) + +* **저자:** Shirui Pan, Linhao Luo, et al. +* **요약:** 거대 언어 모델(LLM) 시대에 지식 그래프가 나아갈 길을 제시하는 최신 로드맵 논문입니다. LLM을 활용하여 더 정확하게 지식 그래프를 구축하는 방법, 반대로 구축된 지식 그래프를 활용하여 LLM의 환각(Hallucination)을 줄이고 답변의 신뢰도를 높이는 방법 등, 두 기술의 상호 보완적인 발전 방향을 세 가지(KG-enhanced LLMs, LLM-augmented KGs, Synergized LLMs + KGs)로 나누어 체계적으로 제안합니다. +* **링크:** [https://arxiv.org/pdf/2306.08302.pdf](https://arxiv.org/pdf/2306.08302.pdf)