Гость
Map
Форумы / Вопросы по IT [закрыт для гостей] / Поиск по текстовым файлам / 11 сообщений из 11, страница 1 из 1
30.03.2022, 00:18
    #5923
tkzv
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Поиск по текстовым файлам
Имеется несколько гигабайт текстовых файлов на английском языке. Нужен способ искать файлы по ключевым словам быстрее, чем grep. Пока попробовал сделать базу SQLite в каких файлах встречается каждое слово. Получилось заметно быстрее, но с непривычки тяжело писать запросы на SQL, и размер базы ненамного меньше объёма всех текстов. А что есть ещё?
...
Рейтинг: 0 / 0
30.03.2022, 20:07
    #6468
eNose
Участник
[не активирован]
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Поиск по текстовым файлам
Можно попробовать сделать самопальный полуаналог soundex оркла.
В принципе почти как ты и сделал, но выкинув гласные и множественные числа.
...
Рейтинг: 1 / 0
Нравится: Tayfur
02.04.2022, 11:19
    #8466
Просто Трёп
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Поиск по текстовым файлам
Загрузить все на гуглодрайв и воспользоваться гуглопоиском уже предлагали?
:)
...
Рейтинг: 0 / 0
04.04.2022, 15:11
    #9576
tkzv
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Поиск по текстовым файлам
Просто Трёп  02.04.2022, 11:19
[игнорируется]
Загрузить все на гуглодрайв и воспользоваться гуглопоиском уже предлагали?
:)
Гуглодрайв позволяет грузить материалы, нарушающие авторские права или подрывающие авторитет Демпартии?
...
Рейтинг: 0 / 0
08.04.2022, 16:52
    #12514
Просто Трёп
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Поиск по текстовым файлам
Запейшу в блокнотег. ткзв подрывает авторитет Демпартии.
...
Рейтинг: 0 / 0
09.04.2022, 13:28
    #13010
Tayfur
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Поиск по текстовым файлам
Просто Трёп  08.04.2022, 16:52
[игнорируется]
Запейшу в блокнотег. ткзв подрывает авторитет Демпартии.
Ваша Демпартия давно сгнила.
...
Рейтинг: 0 / 0
04.05.2022, 13:59
    #28997
Горбатый ёж
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Поиск по текстовым файлам
tkzv  30.03.2022, 00:18
[игнорируется]
Имеется несколько гигабайт текстовых файлов на английском языке. Нужен способ искать файлы по ключевым словам быстрее, чем grep.
https://ru.wikipedia.org/wiki/Elasticsearch
Посмотри.
Впрочем я не уверен, что оно умеет имена файлов выдавать, но я в API не смотрел, я только использовал.
...
Рейтинг: 0 / 0
04.05.2022, 19:47
    #29291
romus
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Поиск по текстовым файлам
tkzv  30.03.2022, 00:18
[игнорируется]
Имеется несколько гигабайт текстовых файлов на английском языке. Нужен способ искать файлы по ключевым словам быстрее, чем grep. Пока попробовал сделать базу SQLite в каких файлах встречается каждое слово. Получилось заметно быстрее, но с непривычки тяжело писать запросы на SQL, и размер базы ненамного меньше объёма всех текстов. А что есть ещё?
проиндексируй, сцуко, содержимое файлов и ищи.
...
Рейтинг: 0 / 1
Не нравится: tkzv
04.05.2022, 22:15
    #29429
bk0010
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Поиск по текстовым файлам
MyBase от www.wjjsoft.com.
...
Рейтинг: 0 / 0
11.05.2022, 16:42
    #34110
tkzv
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Поиск по текстовым файлам
romus  04.05.2022, 19:47
[игнорируется]
tkzv  30.03.2022, 00:18
[игнорируется]
Имеется несколько гигабайт текстовых файлов на английском языке. Нужен способ искать файлы по ключевым словам быстрее, чем grep. Пока попробовал сделать базу SQLite в каких файлах встречается каждое слово. Получилось заметно быстрее, но с непривычки тяжело писать запросы на SQL, и размер базы ненамного меньше объёма всех текстов. А что есть ещё?
проиндексируй, сцуко, содержимое файлов и ищи.
Чем?
...
Рейтинг: 0 / 0
11.05.2022, 16:44
    #34112
tkzv
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Поиск по текстовым файлам
bk0010  04.05.2022, 22:15
[игнорируется]
MyBase от www.wjjsoft.com.
Правильная ссылка: http://www.wjjsoft.com/mybase.html По HTTPS не открывается.
...
Рейтинг: 0 / 0
Форумы / Вопросы по IT [закрыт для гостей] / Поиск по текстовым файлам / 11 сообщений из 11, страница 1 из 1
Целевая тема:
Создать новую тему:
Автор:
Найденые пользователи ...
Разблокировать пользователей ...
Читали тему (2): Анонимы (2)
Читали форум (2): Анонимы (2)
Пользователи онлайн (104): Анонимы (102), Yandex Bot 1 мин., Bing Bot 5 мин.
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]