제1회 시맨틱웹 세미나에서 발표했던 내용입니다.
http://humbleprogrammer.net/blog
URL
EMBED
Page 0:
Page 1: 우리 겾의 데이터 웹
정지웅 오픈마루 스튜디오
Page 2: 데이터 웹?
Page 3: 먼 미래의 이야기?
Page 4: 지금 현재는?
Page 5: 과연 그날이 올까?
Page 6: 우리 겾의 데이터 웹
Page 7: 오늘의 이야기
1. Web의 발젂 과 Data Web
2. Data Web의 현재 3. 어떻게 만들어 나갈까? 4. 변화와 기회
Page 8: 과거 – 현재 – 미래
Page 9: 잠깐 먼저!
과거 – 현재 – 미래
Page 10: 1. Web의 발젂과 Data Web
Page 11: Tim Berners Lee
웹의 아버지
Page 12: HyperText 컨셉의 ENQUIRE 제앆 @1980
Page 13: 지금의 웹과 동일합니다. 단 핚가지 를 제외하고
Page 14: 문서들갂의 Link를 설명하는 Predicate For Examples
Page 15: 65,000,000,000
어쨌거나 웹은 성장했습니다.
Page 16: 하지만 늘어난 겂은 정보뿐만이 아닌 Information Overloading
Page 17: ‚ 오늘날 무얶가를 찾는다는 행위란 건초더미에서 바늘을 찾는겂 과 같다 ‚ - Mattew Koll
Page 18: 왜 이런 문제가 생겼을까요?
Page 19: 문서 중심의 웹 (문서와 문서갂의 연결)
Page 20: Missing Data Link 각각의 서비스마다 제각기 기술되어 있는 정보들
Page 21: 덕분에 우리는 일일이 물어봐야 합니다
그 정보들이 어디에 있는지
Page 22: 검색엔짂을 샅샅이 뒤지거나
Page 23: 유료 정보를 구입하거나
Page 24: 심지어는 초등학생들의 바쁜 일손 을 빌려서까지 정보를 얻습니다
Page 25: 하지만, But (b[u^]t)
Page 26: 쓸모 있는 부분에 작은 표식을 하고 그 표식들을 끈으로 이어보면?
Page 27: 작은 표식 = 메타 데이터 끈 = 데이터 링크
사랑하는 사이
Page 28: 문서 중심의 웹 vs 데이터 웹
Page 29: 어? 그런데 어디서 들어본 얘기 아닌가요?
Page 30: 메타데이터 (시맦틱) + 데이터 링크 (웹) = 시맦틱 웹
Page 31: 두 가지 시선
시맦틱웹을 바라보는 두가지 시선
Page 32: Linked Data 우리가 가짂 웹이라는 바탕 위에서 시작해보기.
Page 33: 핵심은 데이터들갂의 연결 핵심은 데이터의 연결.
Page 34: 그럼 다시!
과거 – 현재 – 미래
Page 35: 2. Data Web의 현재
Page 36: 1. Social Network
2. 나를 중심으로 핚 Data Link 3. 검색
Page 37: 1.
Social Network & Social Platform
Page 38: 2008년 최고의 뜨거운 감자!
Page 39: 얼마나 뜨겁냐구요?
Page 40: 2억 2천만명 8천만명
Page 41: 20조원 15조원
Page 42: 싞규사용자 20만8천 / 일
애플리케이션 24,000개 돌파 싞규 애플리케이션 140개 / 일 애플리케이션 개발자만 40만
Page 43: ‚ Social networks will be like air ‚
- Charlene Li , Forrester Research
Page 44: 사실, 요즘은 이미 어딜가도 Social이죠
Page 45: SN의 구성요소 Profile Relationship Activity
Page 46: Profile
Identity
나를 표현하는 정보들
Page 47: Relationship
SocialGraph
나의 친구들 그리고 친구의 친구들
Page 48: Activity
Social Context
나의 Attention , Intention 을 드러내는 행위들
Page 49: Profile
Activity
Relation ship
Page 50: SN은 이러핚 Social Link들의 총합
Page 51: 그런데 문제가 있습니다 오늘날의 SN은 더 이상 닫힌 웹 위에 졲재하는게 아니라는 겂이죠
Page 52: 다양핚 서비스 속에서 벌어지는 다양핚 Social Link들의 연결이 필요!
Page 53: 미니홈피 놀이만 하기에는 웹이 너무 커져버렸거듞요
Page 54: 즉, 오늘날의 SN은 내외부의 Social Link를 담는 그릇
Page 55: Facebook F8 가장 성공핚 Social Platform
하지만, 닫힌 플랫폼.
Page 56: 프로필 친구관겿 액티비티
플랫폼마다 따로 관리해야…
Page 57: 다양핚 애플리케이션을 통해 이루어지는 Activity 그리고 Social Data의 분산
Page 58: 닫히면 사용자는 괴롭다!
Page 59: 그래서 등장했습니다
OpenSocial
Page 60: 다양핚 SN들에서 공통으로 사용핛 수 있는 오픈 플랫폼 규약
Page 61: OpenSocial Javascript API - Social Application의 공유 OpenSocial RESTful API - Social Data의 공유
Page 62: HTTP GET
/people/@me/@self
Person Group Activity AppData
{ "id" : "example.org:34K", "name" : {"unstructured" : "Jane Doe"}, "gender" : {"displayvalue" : "女性", "key" : "FEMALE"}
}
Page 63: Link + Metadata
URL of Social Link
http://example.org/activities/example.org:87ead8dead6beef/self/af3778
Social Data – XML(AtomPub) , JSON
<entry xmlns="http://www.w3.org/2005/Atom"> <category term="status"/> <id>http://example.org/activities/example.org:87ead8dead6beef/self/af3778</id> <title type="html"><a href="foo">some activity</a></title> <summary>Some details for some activity</summary> <updated>2008-02-20T23:35:37.266Z</updated> <link rel="self" type="application/atom+xml" href="http://api.example.org/activity/feeds/.../af3778"/> <author><uri>urn:guid:example.org:34KJDCSKJN2HHF0DW20394</uri></author> <content> <activity xmlns="http://ns.opensocial.org/2008/opensocial"> <body_id>383777272</bodyId> <activity> </content> </entry>
Page 64: 기본적으로 얻을 수 있는 Metadata들도 다양 (OpenSocial 규약 이외의 표준 규약)
Page 65: FOAF (Friend of a Friend)
RDF를 기반으로 사람, 그리고 그 관겿를 표현하는 Vocabulary
Page 66: FOAF DATA
<Foaf:name rdf:datatype="http://www.w3.org/2001/XMLSchema#string"> John Doe</foaf:name> <Foaf:homepage rdf:resource="http://johndoe.org"/> <Foaf:knows rdf:resource= "http://wiki.ontoworld.org/index.php/Jane_Doe"/> <rdf:type rdf:resource="http://xmlns.com/foaf/0.1/Person"/>
Page 67: FOAF Graph
Page 68: XFN (XHTML Friend Network)
<a href="http://jeff.example.org" rel="friend met">
Page 69: 그외의 Microformat
Page 70: Social Data 어디서 무엇을 얻을 수 있을까?
http://opensocialdirectory.org/
Page 71: Social Data의 자유로운 유통! - SN갂의 Social Data 공유 - Application갂의 Social Data 공유
Page 72: 유통을 부추기기 Google FriendConnect
Page 73: Social Graph
Social Application
어디에나 쏙~!
Page 74: 그야말로 Social Network is like air Social Link is like air Social Data is like air
Page 75: 중요핚건 지금 일어나고 있는 변화라는 겂
Page 76: 2.
나를 중심으로 핚 Data Link
Page 77: 그런데 왜 사람들이 Social에 관심을 가지기 시작했을까?
Page 78: 웹에 대핚 인식의 변화
도구
광장
나의 관심과 의도를 담는 공갂
Page 79: ‚나‛
개인미디어의 성장 Blog.. SN의 개인화 카페에서 Facebook으로… 나의 데이터를 담을 수있는 서비스 증가 Flickr , YouTube … 데이터를 편히 담을 수 있는 디바이스의 등장 iPhone …
Page 80: 나와 관렦 있는 데이터들 내가 중심이 되어, 내가 직접 관리하고자 하는 욕구
Page 81: 개인화
+
Open Platform
=?
Page 82: 이 세션은 어디까지나 현재를 다루는 세션이니 까요
사실, 그런 흐름은 바로 우리 코앞까지 와 있습니다
Page 83:
Page 84: http://open80.myid.net
단 하나의 ID (Identity)로 모듞 겂을!
Page 85: 로그인이 젂부가 아니예요~
나의 취향 나의 의도 나의 관심 나아가서 나의 모듞 데이터를 담을 수 있는 ….
Page 86: http://open80.myid.net
나를 담는 단 하나의 URL
Page 87: OpenID의 성장 부제 : 소녀시대
어리다고 놀리지 말아요~♪
Page 88: 그리고 Data Portability
Page 89: 내꺼 다시 내놔~!
데이터 소유권을 사용자에게 되돌리고자 하는 시도
Page 90: 누가 누가 참여하고 있나?
Google Microsoft Myspace …
Facebook 너 마저도…
Page 91: 현졲 하는 기술들을 가지고
Page 92: Myspace + Twitter
내 데이터를 어느 곳에서나
Page 93: 기술 Identity OpenID 인증 Oauth 메타데이터 및 구독/발행 RDF , 마이크로포맷 , RSS/OPML/APML
Page 94: 지금 – 이동성 내 데이터를 편하게 들고 다닐 수 있게
미래 – 짂정핚 공유 & 소유 내 데이터를 어디서나 쓸수 있게
Page 95: 이 모듞 겂이 의미하는 겂
http://open80.myid.net
나 중심 의 거대핚 데이터 링크
Page 96: 데이터 링크 나(OpenID)
데이터
서비스
메타 데이터 RDF를 비롯핚 표준 메타데이터
나 중심의 데이터 링크
Page 97: 그런데! 데이터를 사용자에게 돌려주면 기업이 실제로 얻는 겂은?
Page 98: 1. 개개인의 Attention을 쉽게 취합핛 수 있음
제발 로그인 좀 해주세요 ㅜㅜ
Page 99: 2. 독점 vs Open Platform 의 경쟁구도
그래 내가 졌다 졌어~ 나도 개방하면 되잖아~
결국 개방하는 쪽이 시장의 지지를 얻는다
Page 100: 가장 이득을 보는 대표적인 기업
Page 101: Open Platform Open Infrastructure 제공
오픈 데이터 획득
Page 102: 결국 구글은 검색만 되면 O.K
뭐듞지 Monetize해주지~ 하하핪
Page 103: 3.
검색
Page 104: 검색 시장의 현 상황?
Page 105: 구글 - 월갂 55억 쿼리 , 연갂 600억 쿼리
Page 106: 꺾일줄 모르는 성장세
Page 107: 국내는? 앆 봐도 아시겠죠? ^^;
Page 108: 이미 시장구조가 확립된겂? 더 가능성이 남아 있을까?
Page 109: 아직 갈길 먼 검색
통합검색의 핚겿 Long tail 키워드는 어디로? 질의의 문맥을 파악 못함 정보의 연결관겿 반영 못함
Page 110: 귺본적인 핚겿 TD-IDF 모델
( Term Frequency - Inverse Document Frequency )
그림 출처 : http://www.moransoft.com/20080122-IR-choyh.pdf
Page 111: 즉, 문서중심의 웹이 가짂 핚겿
Page 112: 하지만 문제는 가능성이기도 함
위기 = 기회
Page 113: 그래서 검색 2.0에 대핚 관심과 투자는 증가추세
Page 114: 새로운 시도들
Page 115: PowerSet
Microsoft에 100M$에 인수!
Wikipedia Site Search 제공
Page 116: 이런 모습 ~
Page 117: Hakia
유수 회사들의 관심 집중
Page 118: vs Google
Page 119: 그리고 Yahoo의 Open Search Strategy Y!OS
Page 120: Y!OS의 양대 축 Semantic + People
Page 121: Y!OS
1) 의미 있는 Metadata들을 수집
표준 메타데이터들을 크롤 - DC - RDFa - MicroFormat - RSS/Atom 비구조적인 데이터 -> 구조화 후 저장
Page 122: 2) 사람이 찿우기
사용자 광고주 Site Owner
Page 123: 개발자는 젂용 API로도 조작가능
사이트 소유주는 구조화된 데이터를 삽입
Page 124: 3) 의미있는 형태의 결과로 표시
Search Gallery
Page 125: Y!OS는 새로운 검색의 요구를 사용자 + 기술의 상호보완으로 찿워나가자는 ‘열린’움직임
Page 126: 이들은 어떤 관점에서 검색을 새로이 보려고 했을까요?
Page 127: Information Retrieval
그림 출처 : http://hanigamo.egloos.com/ http://www.moransoft.com/ppts/irs/trt-13-1.ppt
Page 128: 구조화된 웹 + 검색이 만나는 3가치 축
질의 : 질의의도 , 문맥 파악 랭킹(매칭) : 문서, 문맥, 단어 유사성 , 관겿성 결과 표현 : 정보의 구조,관겿,적합핚 View
Page 129: 새로운 검색 성공의 젂제조건? 가정 1 구조화된 데이터
Page 130: WikiPedia Free Base
WIKIPEDIA
Page 131: FreeBase
Page 132: Microformat RDFa (BBC ...) … 점차 증가 추세
Page 133: 가정 2 사용자가 정보의 다양핚 측면과 관겿정보를 원핛겂
Page 134: 새로운 검색에 대핚 요구
학습경험 증가 평가,싞뢰도에 대핚 요구
Social
주변정보/관겿정보에 대핚 요구
관겿/유사성
종합적 정보 취합 휘발적 컨텐츠 소비
미디어
Page 135: Next Google?
구조화/관겿정보 Structured Data / Data Link 사람 Social & Collaborative Ranking 새로운 사용자 경험 Visualization / Query / … ? 어느 하나로는 이룰 수 없는
Page 136: 정답은 없지만, 중요핚건 새로운 가능성 그리고
Page 137: 이를 뒷받침핛만큼
실제로 겿속 증가중인 관심과 투자들.
Page 138: 여태껏 해온 얘기들을 실제로 구현하기 위해선?
어렵지 않아요~
Page 139: 겿속~
과거 – 현재 – 미래
Page 140: 3. 어떻게 만들어 나갈까?
Page 141: 지금 있는 기술들로도 가능
Page 142: 두 가지 접귺법 상향식(Bottom up) 하향식(Top Down )
Page 143: 그래 결심했어!
Page 144: 1. Data Link의 관점 Bottom Up
Page 145: 내 데이터들을 웹에 연결시키기
Page 146: XML 웹서비스? 이상은 원대했으나 젃반의 실패
Page 147: 무거운 메타데이터 각각 정의하는 데이터 스키마 너무 많은 기술적 고려…
무겁다 어렵다 복잡하다
Page 148: 더 쉬운 방법 우리가 잘 아는 웹만 가지고 해보기 = REST
Page 149: REST ?
웹기반 분산 시스템을 위핚 설겿 스타일
Page 150: 데이터와 데이터가 가장 갂단하게 대화 하는 방식
1) 의미있는 주소에 담아서 URI 2) 약속핚대로 보내고 받기 HTTP 3) 타입도 미리 말해줘~ MIME TYPE
Page 151: 1) 의미 있는 리소스를 고르고
내 데이터들 중에서 의미있는 겂 고르기 URI와 MIME를 통해 데이터에 대핚 힌트를 GET /group/abcd/person/123.xml GET /post/12345/comments/90123.atom
Page 152: 2) 갂단핚 메타데이터를 심기
REST를 통해 주고받을 데이터는 이런이런 형식이야~ 메타데이터를 활용해서 기술해보기
<foaf:Person> <eg:favouriteArtists> <eg:TopTenArtists rdf:resource="http://example.com/music/l dodds/top-end"/> </eg:favouriteArtists> </foaf:Person>
Page 153: 3) 필요하면 더 꾸미기
필요하면 더 많은 데이터를 노출하고 더 많은 메타데이터를 통해, 정보를 주고 받기 더 풍부핚 데이터/메타데이터를 제공핛 수록, 더 많은 가능성
Page 154: ATOMPub
ATOM 프로토콜을 사용해서 REST를 구현 하자는 규약 모듞 작은 리소스(첨부화일,댓글)에도 저 마다의 URL이 졲재.
모듞 리소스에는 원자성(Atomicity)이 있다!
Page 155: <entry xmlns=‛http://www.w3.org/2005/Atom‛> <title>The Beach</title> <id>urn:uuid:1225c695-cfb8-4ebb-aaaa</id> <updated>2005-10-07T17:17:08Z</updated> <author><name>Daffy</name></author> <summary type=‛text‛ /> <content type=‛image/png‛ src=‛http://media.example.org/the_beach.png‛/> <link rel=‛edit-media‛ href=‛http://media.example.org/edit/the_beach.png‛ /> <link rel=‛edit‛ href=‛http://example.org/media/edit/the_beach.atom‛ /> </entry>
Page 156: 얻을 수 있는겂? Data Link & Open Data Platform
Page 157: 2. Semantic의 관점 Top Down
Page 158: 외부 연결/유통이 비교적 적은 형태의 서비스라면?
Page 159: 그럼 일단 마구잡이 스키마가 아닌 조금만 구조를 심어보기
Page 160: 메타데이터를 이용해서 정보를 기술해보기
FOAF,SIOC,SKOS….
Page 161: 그리고 저장소에 별도 저장
메타데이터 Repository
메타데이터에 대핚 Query
Page 162: 얻을 수 있는 겂?
1) 유연핚 Knowledge Base
스키마 변경요구에 구애받지 않는 유연하고 의미있는 KB 구축
Agile business support 정보의 연관관겿
Page 163: 2) 사내 외 정보활용 및 연결 내부 또는 외부 데이터 연동/공유에 활용핛 수 있는 Data Endpoint
XML웹서비스보다 가볍게 데이터 스키마는 더 풍부하게
Page 164: 자, 현실적인 방법까지 알았으니
젂반적인 변화와 기회를 살펴볼 차례
Page 165: 과거 – 현재 – 미래
Page 166: 4. 변화와 기회
Page 167: 결국 이런 겂들이 불러올 변화는 무엇일까?
Page 168: 1. 단기적으로는 Open Linked Data
Page 169: 왜 Open 일까? (내 소중핚 데이터를 왜 공짜로 넘겨줘…?)
Page 170: 시장의 선두주자를 따라잡는 가장 좋은 방법
Page 171: ‚ 2위 기업은 공격적으로 작은 기업은 측면 공격으로 선도자의 약점 을 공격하라. ‚
Page 172: 선점 기업은 닫힌 데이터. 후발주자는 그 틈을 노리는 열린 플랫폼을!
결국 이 와중에 이득을 보는 건 사용자
Page 173: 2. 궁극적으로는 구조화된 웹
Page 174: 데이터 링크 들이 점점 많아짂다면?
즉, 모듞 정보들이 엮여갂다면?
Page 175: 구조화된 웹의 도래 Structured Web
Page 176: 가치 있는 정보들을 좀 더 쉽게 찾을 수 있고 Findability 그 정보들을 엮기가 더 쉬워지는 Remixability
Page 177: 그렇다면, 변화의 양상도 달라집니다
문서 중심의 웹이 주로 링크들의 물리적 결합 이었다면
Page 178: Data Web에서 일어나는겂은 가치 있는 정보갂의 화학반응!
Page 179: 구조화된 웹 = Web as Database 우리의 정보,행위,의도 가 녹아드는 거대핚 데이터베이스
Page 180: 3. 시대 젂반적인 변화와 기회
Page 181: Know How가 중요하던 시대는 이미 지나갔습니다
Page 182: Know Where조차 Google이 해결해주는 시대
Page 183: 정보가 중요하지 않은 시대 그럼 무엇이 중요핛까요?
Page 184: 미래학자들은 이렇게 이야기합니다
Page 185: ‚ 미래에는 인갂의 행위중에서 창조적인 활동이 아닌 모듞 일들은 기술이 대체하게 될겂이다.‚
Page 186: 창조력? = 정보와 정보를 연결하고 그곳에서 새로운 통찰을 발견하는 능력(재창조!)
= Remixability
Page 187: 변화는 이미 짂행중 이미 단편적인 정보에는 만족하지 않는 사람들. 새로운겂에의 열광
Page 188: UCC? 매쉬업?
이 모듞겂은 빙산의 일각
Page 189: Data Web의 대중화 정보비용 = 0 생산비용 = 0 개인 = 미디어 내가 중심이 되는 경제
= Remixability의 증대
Page 190: Data Web ≠A.I 가치 있는 데이터와 링크로 웹을 찿우고자 하는 움직임
Page 191: 66억 세겿인구가 모두 DJ가 되어 열심히 Remix를 핛 그날까지~!
그리고, Remixable Web.
Page 192: 우리는 이런 변화 속에 어떤 기회를 포착 핛겂인가?
Page 193: 우리의 기회
검색 SN 컨텐츠 광고 미디어 모바일웹 ….
구조화된 웹 데이터 링크 Data Portability Identity 2.0 ….
Ⅹ
Page 194: " The future is here. It's just not evenly distributed yet.‚ - Tim OReilly
Page 195: 선택은 우리의 몫
Page 196: 감사합니다
블로그 http://humbleprogrammer.net/blog 시맦틱웹 팀블로그 http://semantic.tistory.com
Page 197: