powered by simpleCommunicator - 2.0.18     © 2024 Programmizd 02
Map
Форумы [новые:1] / Поиск: Искать ответы на сообщение: #484809  
5 сообщений из 5, страница 1 из 1
Вопросы по форуму / Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
    #484809
sergey11
Скрыть профиль Поместить в игнор-лист
Участник
[игнорирует гостей]
basename  14.07.2023, 19:16
[игнорируется]
Смежные темы

Грядёт нечто ГРОМАДНОЕ в рамках реорганизации форума! Вспомнить всё!
Ноутбук Деды!
Цитата 
[игнорируется]
За год до СВО я тоже мутил проект:) У меня кое что есть

Выкачивание ПТ

Форум ПТ на sql.ru прекратил существование быстро и неожиданно 3 августа 2018 года. Темы и сообщения не были удалены физически, жужель просто в коде поставил заслонку
If ПТ then Облом
Поэтому доступ отсутствует даже у модераторов. Однако через поиск и избранные темы еще видны, но войти в них нельзя.
Казалось бы, шансов подобраться к постам никаких, но нашелся въедливый участник форума, который таки нашел лазейку. При вызове поста на цитирование защиты нет. Об этой лазейке он сообщил мне, я как узнал о ней сразу проверил еще одну догадку – вызов поста на редактирование. Оно тоже оказалось незащищенным, более того любой модератор может вызывать на редактирование любой пост, даже если он не в подотчетном форуме.
Это был охуенный шанс. Решением было просто пробежаться по всем постам от 1 до 22000000. Изначально мы не знаем какой теме и какому форуму принадлежит пост, поэтому бежать нужно через все и проверять.
Вызвать пост на редактирование и забрать BB код. Это намного лучше и эффективнее чем обратный парсинг HTML.
Но у этого решения был ряд ограничений, многие из которых удалось решить, но не все.
Проблема 1: При вызове на редактирование не подгружается ни дата поста, ни id топика, ни id форума. Но название топика есть!
Узнать id топика.
Переходим напрямую к текущему сообщению по id сообщения, получаем отлуп что тема не доступна, но в урл уже фигугирует id топика.
Узнать id форума.
Добавляем топик по известному id топика в избранное, напротив него в таблице появляется название и id форума. Выпарсиваем его.

Узнать дату поста.
Тут только приблизительно. Но хорошо то, что кроме ПТ часто постили и на других форумах, так что когда мы бежим по постам, мы сохраняем дату последнего поста, если пост доступен (потому что он на неудаленных форумах), и когда нарываемся на пост из ПТ, берем дату последнего доступного поста. Таким образом неточность даты времени не превышала пары часов, а основном пары минут.
Проблема 2: Аттачменты недоступны.
У жужеля 1 пост 1 аттачмент, выдергивать их легко, но там тоже стоит залонка
If ПТ then Облом
И режим редактирования здесь не поможет.
Частичное решение я нашел, но его нельзя было использовать массово. Решение – перенос темы в форум Тест, выкачивание аттачей, возврат темы обратно.
Для тем А51 у жужеля оказался еще какой-то запрет. Переносить оттуда их оказалось нельзя. Так что аттачи из А51 недоступны совершенно.
Для тем ПТ с аттачами есть одна проблема. Перенос темы отражается в модераторском логе. Если бы я переносил десятки тысяч тем из ПТ и обратно, весь модерлог был бы засран моими логами переноса и я бы спалился моментально, мне дали бы гусем по пизде.
Поэтому я решил медленно и осторожно переносить только самые важные темы которые я таковыми счел. Тем не менее дмидек меня все равно спалил, но эту акцию я приурочил к недоступности скруля в течении нескольких суток – типа разволновался что скруль совсем всё и решил спасти пару тем для истории.
Возможно в будущем когда / если жужель будет закрывать скруль, можно будет провернуть эту акцию со всеми темами ПТ. А может даже он раздобрится и даст доступ по нормальному на время.
Проблема 3: Удаленные посты недоступны ни на редактирование ни на цитирование (выдается error 500). Удаленные темы доступны без проблем.
Решается аналогично – путем переноса темы в Тест и просмотра в режиме удаленных. Тут уже парсинг другой. На редактирование вызвать нельзя, пришлось делать обратный парсинг HTML удаленных постов.
Точно также переносил лишь темы которые счел важными.
Весь этот сложный процесс в итоге показал скорость скачивания 90-110 постов в минуту. В пересчете на дни это где то 150 дней. Чтобы ускорить этот процесс я сделал два процесса – из пункта А и Б два поезда выехали навстречу друг другу. Один процесс парсил сначала, другой с конца, и в один прекрасный день они встретились.
В общем с перерывами я выкачал посты за 127 дней, и у меня есть почти полноценный архив ПТ и А51.
Цитата 
[игнорируется]
Эту акцию я назвал "Проект Дикобраз" и даже уже подготовил архим под урлом dikobraz.nosql.ru :)
Ничего человеческого нет в этой истории. Про Жужеля и так понятно. Непонятно зачем Деда закрыл дедофорум.
...
Рейтинг: 0 / 0
Вопросы по форуму / Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
    #485075
Мудило
Скрыть профиль Поместить в игнор-лист
Участник
[не активирован]
sergey11  20.07.2023, 14:22
[игнорируется]
basename  14.07.2023, 19:16
[игнорируется]
Смежные темы

Грядёт нечто ГРОМАДНОЕ в рамках реорганизации форума! Вспомнить всё!
Ноутбук Деды!
Цитата 
[игнорируется]
За год до СВО я тоже мутил проект:) У меня кое что есть

Выкачивание ПТ

Форум ПТ на sql.ru прекратил существование быстро и неожиданно 3 августа 2018 года. Темы и сообщения не были удалены физически, жужель просто в коде поставил заслонку
If ПТ then Облом
Поэтому доступ отсутствует даже у модераторов. Однако через поиск и избранные темы еще видны, но войти в них нельзя.
Казалось бы, шансов подобраться к постам никаких, но нашелся въедливый участник форума, который таки нашел лазейку. При вызове поста на цитирование защиты нет. Об этой лазейке он сообщил мне, я как узнал о ней сразу проверил еще одну догадку – вызов поста на редактирование. Оно тоже оказалось незащищенным, более того любой модератор может вызывать на редактирование любой пост, даже если он не в подотчетном форуме.
Это был охуенный шанс. Решением было просто пробежаться по всем постам от 1 до 22000000. Изначально мы не знаем какой теме и какому форуму принадлежит пост, поэтому бежать нужно через все и проверять.
Вызвать пост на редактирование и забрать BB код. Это намного лучше и эффективнее чем обратный парсинг HTML.
Но у этого решения был ряд ограничений, многие из которых удалось решить, но не все.
Проблема 1: При вызове на редактирование не подгружается ни дата поста, ни id топика, ни id форума. Но название топика есть!
Узнать id топика.
Переходим напрямую к текущему сообщению по id сообщения, получаем отлуп что тема не доступна, но в урл уже фигугирует id топика.
Узнать id форума.
Добавляем топик по известному id топика в избранное, напротив него в таблице появляется название и id форума. Выпарсиваем его.

Узнать дату поста.
Тут только приблизительно. Но хорошо то, что кроме ПТ часто постили и на других форумах, так что когда мы бежим по постам, мы сохраняем дату последнего поста, если пост доступен (потому что он на неудаленных форумах), и когда нарываемся на пост из ПТ, берем дату последнего доступного поста. Таким образом неточность даты времени не превышала пары часов, а основном пары минут.
Проблема 2: Аттачменты недоступны.
У жужеля 1 пост 1 аттачмент, выдергивать их легко, но там тоже стоит залонка
If ПТ then Облом
И режим редактирования здесь не поможет.
Частичное решение я нашел, но его нельзя было использовать массово. Решение – перенос темы в форум Тест, выкачивание аттачей, возврат темы обратно.
Для тем А51 у жужеля оказался еще какой-то запрет. Переносить оттуда их оказалось нельзя. Так что аттачи из А51 недоступны совершенно.
Для тем ПТ с аттачами есть одна проблема. Перенос темы отражается в модераторском логе. Если бы я переносил десятки тысяч тем из ПТ и обратно, весь модерлог был бы засран моими логами переноса и я бы спалился моментально, мне дали бы гусем по пизде.
Поэтому я решил медленно и осторожно переносить только самые важные темы которые я таковыми счел. Тем не менее дмидек меня все равно спалил, но эту акцию я приурочил к недоступности скруля в течении нескольких суток – типа разволновался что скруль совсем всё и решил спасти пару тем для истории.
Возможно в будущем когда / если жужель будет закрывать скруль, можно будет провернуть эту акцию со всеми темами ПТ. А может даже он раздобрится и даст доступ по нормальному на время.
Проблема 3: Удаленные посты недоступны ни на редактирование ни на цитирование (выдается error 500). Удаленные темы доступны без проблем.
Решается аналогично – путем переноса темы в Тест и просмотра в режиме удаленных. Тут уже парсинг другой. На редактирование вызвать нельзя, пришлось делать обратный парсинг HTML удаленных постов.
Точно также переносил лишь темы которые счел важными.
Весь этот сложный процесс в итоге показал скорость скачивания 90-110 постов в минуту. В пересчете на дни это где то 150 дней. Чтобы ускорить этот процесс я сделал два процесса – из пункта А и Б два поезда выехали навстречу друг другу. Один процесс парсил сначала, другой с конца, и в один прекрасный день они встретились.
В общем с перерывами я выкачал посты за 127 дней, и у меня есть почти полноценный архив ПТ и А51.
Цитата 
[игнорируется]
Эту акцию я назвал "Проект Дикобраз" и даже уже подготовил архим под урлом dikobraz.nosql.ru :)
Ничего человеческого нет в этой истории. Про Жужеля и так понятно. Непонятно зачем Деда закрыл дедофорум.
он устал и ушол.
...
Рейтинг: 1 / 0
Нравится: Гарыныч
Вопросы по форуму / Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
    #485097
Гарыныч
Скрыть профиль Поместить в игнор-лист
Участник
[игнорирует гостей кроме]
Мудило  20.07.2023, 22:02
[игнорируется]
sergey11 [игнорируется] 

он устал и ушол.
а Сирожа11, дожил до 45-ти лет, но так нихкуа и не понил.... :((
...
дед-пердед
Изменено: 20.07.2023, 22:43 - Гарыныч
Рейтинг: 0 / 0
Вопросы по форуму / Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
    #485128
Мудило
Скрыть профиль Поместить в игнор-лист
Участник
[не активирован]
Гарыныч  20.07.2023, 22:43
[игнорируется]
Мудило  20.07.2023, 22:02
[игнорируется]
sergey11 [игнорируется] 

он устал и ушол.
а Сирожа11, дожил до 45-ти лет, но так нихкуа и не понил.... :((
ему некогда понимать он в перманентной ажитации то кони не йобаны то девочки убийцы то училка уныло теребит клитор в углу вспоминая Серёгу непечатным тихим словом
...
Рейтинг: 5 / 0
Вопросы по форуму / Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
    #485132
Гарыныч
Скрыть профиль Поместить в игнор-лист
Участник
[игнорирует гостей кроме]
Мудило  20.07.2023, 23:32
[игнорируется]
Гарыныч  20.07.2023, 22:43
[игнорируется]
Мудило  20.07.2023, 22:02
[игнорируется]
sergey11 [игнорируется] 

он устал и ушол.
а Сирожа11, дожил до 45-ти лет, но так нихкуа и не понил.... :((
ему некогда понимать он в перманентной ажитации то кони не йобаны то девочки убийцы то училка уныло теребит клитор в углу вспоминая Серёгу непечатным тихим словом
ахуенно ты щас сказал, мана!!!
...
дед-пердед
Изменено: 20.07.2023, 23:37 - Гарыныч
Рейтинг: 1 / 0
Нравится: Мудило
5 сообщений из 5, страница 1 из 1
Форумы [новые:1] / Поиск: Искать ответы на сообщение: #484809  
Пользователи онлайн (32): Анонимы (20), Bing Bot, serg_tmb, Yandex Bot, NSFuimus, ElenaG 1 мин., Горбатый ёж 1 мин., Vaska Balboa 1 мин., anonymous 2 мин., Redd 7 мин., Просто Трёп 8 мин., unique 8 мин., Шоколадный01 9 мин.
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]