powered by simpleCommunicator - 21.11.28     © 2024 Programmizd 02
Map
Форумы / Тест / Распарсирвание URLs
11 сообщений из 11, страница 1 из 1
Распарсирвание URLs
    #2928061
Программизд 02
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Администратор
Гидроцефалы всех стран соединяйтесь!
Допилил распознавание УРЛов

Обычные урлы

http://sql.ru

http://sql.ru/

http://sql.ru/page:56/

http://sql.ru/page:57

http://sql.ru?a=3&b=4

http://sql.ru/page.php

Урлы со знаками пунктуации как часть их и как завершающие их, но не являющиеся их частью

http://sql.ru?a=3&b=7,2

http://sql.ru?a=3&b=7,2,

http://sql.ru/page.php?a=3&b=4.

http://sql.ru/page.php?a=3&b=4,

http://sql.ru/page.php?a=3&b=4;

http://sql.ru/page.php?a=3&b=4: 18

http://sql.ru/page.php?a=3&b=4?

Урлы со скобками как являющиеся частью их так и когда урл просто взят в скобки и они не являются его частю

http://sql.ru?a=3&b[]=4&b[]=3

http://sql.ru?a=3&b[1]=4&b[2]=3

http://sql.ru?a=3&b=(wer)

http://sql.ru?a=3&b={wer}

http://sql.ru?a=3&b=[wer]

http://sql.ru?a=3&b=(wer)a

http://sql.ru?a=3&b={wer}a

http://sql.ru?a=3&b=[wer]a

(http://sql.ru?a=3&b=(wer))

{http://sql.ru?a=3&b={wer}}

[http://sql.ru?a=3&b=[wer]]

(http://sql.ru?a=3&b=[wer])

(http://sql.ru?a=3&b=4)

(http://sql.ru?a=3&b[1]=4&b[2]=3)

[http://sql.ru?a=3&b=4]

[http://sql.ru?a=3&b[1]=4&b[2]=3]

{http://sql.ru?a=3&b=4}

Урлы взятые в кавычки

"http://sql.ru?a=3&b=4"

'http://sql.ru?a=3&b=4'

Сокращщенные урлы

www.sql.ru

www.sql.ru

Урлы из википедии

https://ru.wikipedia.org/wiki/(1937)#:~:text=Р,666

https://ru.wikipedia.org/wiki/(1937)#:~:text=Р,666,

https://ru.wikipedia.org/wiki/Vulcan_(ракета-носитель)

https://ru.wikipedia.org/wiki/Начальник_Генерального_штаба_(Великобритания)

https://ru.wikipedia.org/wiki/Перепись_населения_СССР_(1937)#:~:text=Руководству страны сообщалось, что «общая,включая контингенты РККА и НКВД6767

И вот красавец монстр, который это делает
Код: PHP
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
var $url_re = "
    ~
    (
      (?:
        https?://                                   # http or https protocol
        |                                           # or
        (?://)?www\d{0,3}[.]                        # www., www1., www2. www999. optionally starting with //
      )
      (?:
        [^\s\[\]\(\)\{\}<>`'\",«»“”‘’\?&/!;:]+      # domain
      )
      (?:                                           # One or more ungreedy:
        [^\s\[\]\(\)\{\}<>`'\"«»“”‘’]+              # Run of non-space, non-brackets, non-punctuation
        |                                           # or
        \([^\s\(\)]*\)                              # balanced parents ()
        |                                           # or
        \[[^\s\[\]]*\]                              # balanced parents []
        |                                           # or
        \{[^\s\{\}]*\}                              # balanced parents {}
      )+
      (?:                                           # One or more greedy:
        [^\s\[\]\(\)\{\}<>`'\",«»“”‘’\.\?&!;:]+     # Run of non-space, non-brackets, non-punctuation
        |                                           # or
        \([^\s\(\)]*\)                              # balanced parents ()
        |                                           # or
        \[[^\s\[\]]*\]                              # balanced parents []
        |                                           # or
        \{[^\s\{\}]*\}                              # balanced parents {}
      )+
    )
    ~xiu
";
...
Изменено: 28.05.2021, 12:14 - Программизд 02
Рейтинг: 0 / 0
Распарсирвание URLs
    #2928085
Гарыныч
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
[игнорирует гостей кроме]
Программизд 02  09.04.2021, 11:49
Допилил распознавание УРЛов

line 1

0 http://sql.ru
1 http://sql.ru/
2 http://sql.ru/page.php

line 2

3 http://sql.ru?a=3&b=4.
4 http://sql.ru?a=3&b=4?

line 2

5 http://sql.ru?a=3&b[1]=4&b[2]=3

line 3

6 (http://sql.ru?a=3&b=4)
7 (http://sql.ru?a=3&b[1]=4&b[2]=3)
8 [[url=http://sql.ru/?a=3&b=4]http://sql.ru?a=3&b=4[/url]]
9 [[url=http://sql.ru/?a=3&b[1]=4&b[2]=3]http://sql.ru?a=3&b[1]=4&b[2]=3[/url]]
10 {http://sql.ru?a=3&b=4}
11 "http://sql.ru?a=3&b=4"

line 4

12 http://sql.ru?a=3&b=7

13 http://sql.ru?a=3&b=(wer)

14 http://sql.ru?a=3&b={wer}

15 http://sql.ru?a=3&b=[wer]

16 http://sql.ru?a=3&b=(wer)a

17 http://sql.ru?a=3&b={wer}a

18 http://sql.ru?a=3&b=[wer]a

19 (http://sql.ru?a=3&b=(wer))

20 {http://sql.ru?a=3&b={wer}}

21 [[url=http://sql.ru/?a=3&b=[wer]]http://sql.ru?a=3&b=[wer][/url]]

22 (http://sql.ru?a=3&b=[wer])

23 https://ru.wikipedia.org/wiki/Vulcan_(ракета-носитель)

24 http://sql.ru/a

25 "http://sql.ru/b"

26 www.sql.ru

27 www.sql.ru

Вот таже самая проверка у жужеля

SQL.RU: 22306340

И вот красавец монстр, который это делает
Код: PHP
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
$re = "~(?xi)
(
  (?:
    https?://                                   # http or https protocol
    |                                           #   or
    (?://)?www\d{0,3}[.]                        # www., www1., www2. www999.
  )
  (?:
  [^\s\[\]()\{\}<>`!;:'\",«»“”‘’\?&/]+          # domain
  )
  (?:                                           # One or more ungreedy:
    [^\s\[\]()\{\}<>`!;:'\",«»“”‘’]+            # Run of non-space, non-()<>
    |                           #   or
    \((?:[^\s()<>]+|(?:\([^\s()<>]+\)))*\)      # balanced parents ()
    |                           #   or
    \[(?:[^\s\[\]<>]+|(?:\[[^\s\[\]<>]+\]))*\]  # balanced parents []
    |                           #   or
    \{(?:[^\s\{\}<>]+|(?:\{[^\s\{\}<>]+\}))*\}  # balanced parents {}
  )+?
  (?:                                           # One or more greeady:
    [^\s\[\]()\{\}<>`!;:'\",«»“”‘’\.\?]+        # Run of non-space, non-()<>
    |                           #   or
    \((?:[^\s()<>]+|(?:\([^\s()<>]+\)))*\)      # balanced parents ()
    |                           #   or
    \[(?:[^\s\[\]<>]+|(?:\[[^\s\[\]<>]+\]))*\]  # balanced parents []
    |                           #   or
    \{(?:[^\s\{\}<>]+|(?:\{[^\s\{\}<>]+\}))*\}  # balanced parents {}
  )+
)~";
шифровка? :))) ( Алекса - Юстасу? )
...
Рейтинг: 0 / 0
Распарсирвание URLs
    #2941353
Программизд 02
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Администратор
Гидроцефалы всех стран соединяйтесь!
...
Рейтинг: 0 / 0
Распарсирвание URLs
    #2941498
Гарыныч
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
[игнорирует гостей кроме]
...
Рейтинг: 0 / 0
Распарсирвание URLs
    #2944805
Husq
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Вот скажи нахуя оно тебе?
...
Рейтинг: 0 / 0
Распарсирвание URLs
    #2944817
Программизд 02
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Администратор
Гидроцефалы всех стран соединяйтесь!
Чтобы было заепись!
...
Изменено: 16.04.2021, 08:59 - Программизд 02
Рейтинг: 1 / 0
Нравится: Владайка
Распарсирвание URLs
    #2944951
Husq
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Программизд 02  16.04.2021, 08:59
Чтобы было заепись!
Шо заебись
Урл это массы гет

Ну зачем его парсить если он и так из гет массива состоит?
...
Рейтинг: 0 / 0
Распарсирвание URLs
    #2944956
Программизд 02
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Администратор
Гидроцефалы всех стран соединяйтесь!
Ты че то походу вообще нихуя не сечешь. Урл нужно находить в тексте и делать его из плейн текста активным кликабельным урлом при этом вычленять его так чтобы не прихватывались лишние символы или наоборот урл не бился где то внутри.
...
Рейтинг: 0 / 0
Распарсирвание URLs
    #2945027
Husq
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Программизд 02  16.04.2021, 09:55
Ты че то походу вообще нихуя не сечешь. Урл нужно находить в тексте и делать его из плейн текста активным кликабельным урлом при этом вычленять его так чтобы не прихватывались лишние символы или наоборот урл не бился где то внутри.
Это ты не сечешь
Я то ещё должен догадаться шо тебе надо?
...
Рейтинг: 0 / 0
Распарсирвание URLs
    #2945663
Программизд 02
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Администратор
Гидроцефалы всех стран соединяйтесь!
Husq  16.04.2021, 10:31
Программизд 02  16.04.2021, 09:55
Ты че то походу вообще нихуя не сечешь. Урл нужно находить в тексте и делать его из плейн текста активным кликабельным урлом при этом вычленять его так чтобы не прихватывались лишние символы или наоборот урл не бился где то внутри.
Это ты не сечешь
Я то ещё должен догадаться шо тебе надо?
Т.е. ты не догадался но уже решил что нахуй не нужно. Типичный хуйшкварка:)
...
Рейтинг: 0 / 0
Распарсирвание URLs
    #2945982
Программизд 02
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Администратор
Гидроцефалы всех стран соединяйтесь!
Допилил распознавание УРЛов

line 1

0 http://sql.ru
1 http://sql.ru/
2 http://sql.ru/page.php

line 2

3 http://sql.ru?a=3&b=4.
4 http://sql.ru?a=3&b=4?

line 2

5 http://sql.ru?a=3&b[1]=4&b[2]=3

line 3

6 (http://sql.ru?a=3&b=4)
7 (http://sql.ru?a=3&b[1]=4&b[2]=3)
8 [http://sql.ru?a=3&b=4]
9 [http://sql.ru?a=3&b[1]=4&b[2]=3]
10 {http://sql.ru?a=3&b=4}
11 "http://sql.ru?a=3&b=4"

line 4

12 http://sql.ru?a=3&b=7

13 http://sql.ru?a=3&b=(wer)

14 http://sql.ru?a=3&b={wer}

15 http://sql.ru?a=3&b=[wer]

16 http://sql.ru?a=3&b=(wer)a

17 http://sql.ru?a=3&b={wer}a

18 http://sql.ru?a=3&b=[wer]a

19 (http://sql.ru?a=3&b=(wer))

20 {http://sql.ru?a=3&b={wer}}

21 [http://sql.ru?a=3&b=[wer]]

22 (http://sql.ru?a=3&b=[wer])

23 https://ru.wikipedia.org/wiki/Vulcan_(ракета-носитель)

24 http://sql.ru/a

25 "http://sql.ru/b"

26 www.sql.ru

27 www.sql.ru

28 https://ru.wikipedia.org/wiki/Начальник_Генерального_штаба_(Великобритания)

29 https://ru.wikipedia.org/wiki/(1937)#~text=Р,666,

29 https://ru.wikipedia.org/wiki/(1937)#~text=Р,666

564545565666675566666tt5666777551

29 https://ru.wikipedia.org/wiki/Перепись_населения_СССР_(1937)#:~:text=%D0%A0%D1%83%D0%BA%D0%BE%D0%B2%D0%BE%D0%B4%D1%81%D1%82%D0%B2%D1%83%20%D1%81%D1%82%D1%80%D0%B0%D0%BD%D1%8B%20%D1%81%D0%BE%D0%BE%D0%B1%D1%89%D0%B0%D0%BB%D0%BE%D1%81%D1%8C%2C%20%D1%87%D1%82%D0%BE%20%C2%AB%D0%BE%D0%B1%D1%89%D0%B0%D1%8F,%D0%B2%D0%BA%D0%BB%D1%8E%D1%87%D0%B0%D1%8F%20%D0%BA%D0%BE%D0%BD%D1%82%D0%B8%D0%BD%D0%B3%D0%B5%D0%BD%D1%82%D1%8B%20%D0%A0%D0%9A%D0%9A%D0%90%20%D0%B8%20%D0%9D%D0%9A%D0%92%D0%946767
...
Изменено: 27.05.2021, 23:53 - Программизд 02
Рейтинг: 0 / 0
11 сообщений из 11, страница 1 из 1
Форумы / Тест / Распарсирвание URLs
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали тему (1): Анонимы (1)
Игнорируют тему (1): kDn
Читали форум (3): Анонимы (3)
Пользователи онлайн (12): Анонимы (10), Yandex Bot, Bing Bot 1 мин.
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]