안녕하세요. 유저스토리랩 BKLove입니다.

일련의 작업이 완료되면 다시 정식으로 변화된 부분을 알려드릴 예정입니다만, 트윗믹스에 접속했을 때 변화된 부분이 있어서 놀라지 않으시도록 작업 내용을 알려드리고자 합니다.

트윗믹스는 현재 트윗 수집 방식을 대폭 업그레이드하고 있습니다. 기존 수집 방식은 한글을 쓰는 트위터 사용자의 일부에 국한됐지만(저희가 당시 분석하기론 30-40%), 변경된 방식은 한국어를 사용하는 사용자 기준의 수집과 한국어로 작성된 메시지를 기준으로 하는 수집, 두가지를 혼용하여 수집하도록 변경됐습니다. 기존의 방식에 비해 커버하는 범위가 더욱 넓어졌습니다. 또한 더욱 실시간으로 업데이트됩니다. 따라서 더욱 정확하게 트위터에서 발생되는 이슈를 파악할 수 있게 되었습니다. 변경 후 현재 트위터 사용자의 규모로 하루에 수집되는 트윗(링크가 포함된 트윗)은 약 25만 트윗 정도로 예상되고 있습니다.

그리고 이번 작업과 관련해서 현재 아래의 문제가 발생하고 있습니다.
1. 수집 방식이 변경된 이전에 수집된 메시지가 표시되지 않고 있습니다. 트윗믹스가 2010년 4월에 오픈하고 현재까지 수집한 메시지가 (벌써) 1,000 만건이 넘는데요. 로직이 변경되면서 이전 데이터와 차이가 생겨서 별도의 통합과정이 필요합니다. 데이터 양이 워낙 많고, 현재 새로운 방식에 대한 안정화를 먼저 진행하고 있어서(새로운 방식을 통해서도 엄청난 데이터가 저장되고 있는탓에) 다소 시간이 걸릴 듯 합니다.
2. 일부 사용자의 프로필 이미지가 표시 되지 않는 부분이 있습니다. 이건 늦어도 내일까지는 업데이트 될 예정입니다.
 
덧. 트윗믹스는 트위터 수집은 물론이고 향후 페이스북을 비롯한 다양한 소셜웹서비스와의 연동할 예정입니다. 다양한 소셜 데이터를 운영하시는 웹서비스, 앱, 블로그, 홈페이지 등에 연동하길 원하시거나, 관련되어 좋은 아이디어를 가지고 계신 분은 언제든 @bklove , bk@userstorylab.com 으로 문의주세요.
 
2010/07/28 20:36 2010/07/28 20:36

Trackback

Trackbackk Address :: http://blog.tweetmix.net/trackback/22

Comment