Map
Форумы / Тест / Распарсирвание URLs / 11 сообщений из 11, страница 1 из 1
09.04.2021, 11:49
    #2928061
Программизд 02
Администратор
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гидроцефалы всех стран соединяйтесь!
Распарсирвание URLs
Допилил распознавание УРЛов

Обычные урлы

http://sql.ru

http://sql.ru/

http://sql.ru/page:56/

http://sql.ru/page:57

http://sql.ru?a=3&b=4

http://sql.ru/page.php

Урлы со знаками пунктуации как часть их и как завершающие их, но не являющиеся их частью

http://sql.ru?a=3&b=7,2

http://sql.ru?a=3&b=7,2,

http://sql.ru/page.php?a=3&b=4.

http://sql.ru/page.php?a=3&b=4,

http://sql.ru/page.php?a=3&b=4;

http://sql.ru/page.php?a=3&b=4: 18

http://sql.ru/page.php?a=3&b=4?

Урлы со скобками как являющиеся частью их так и когда урл просто взят в скобки и они не являются его частю

http://sql.ru?a=3&b[]=4&b[]=3

http://sql.ru?a=3&b[1]=4&b[2]=3

http://sql.ru?a=3&b=(wer)

http://sql.ru?a=3&b={wer}

http://sql.ru?a=3&b=[wer]

http://sql.ru?a=3&b=(wer)a

http://sql.ru?a=3&b={wer}a

http://sql.ru?a=3&b=[wer]a

(http://sql.ru?a=3&b=(wer))

{http://sql.ru?a=3&b={wer}}

[http://sql.ru?a=3&b=[wer]]

(http://sql.ru?a=3&b=[wer])

(http://sql.ru?a=3&b=4)

(http://sql.ru?a=3&b[1]=4&b[2]=3)

[http://sql.ru?a=3&b=4]

[http://sql.ru?a=3&b[1]=4&b[2]=3]

{http://sql.ru?a=3&b=4}

Урлы взятые в кавычки

"http://sql.ru?a=3&b=4"

'http://sql.ru?a=3&b=4'

Сокращщенные урлы

www.sql.ru

www.sql.ru

Урлы из википедии

https://ru.wikipedia.org/wiki/(1937)#:~:text=Р,666

https://ru.wikipedia.org/wiki/(1937)#:~:text=Р,666,

https://ru.wikipedia.org/wiki/Vulcan_(ракета-носитель)

https://ru.wikipedia.org/wiki/Начальник_Генерального_штаба_(Великобритания)

https://ru.wikipedia.org/wiki/Перепись_населения_СССР_(1937)#:~:text=Руководству страны сообщалось, что «общая,включая контингенты РККА и НКВД6767

И вот красавец монстр, который это делает
Код: PHP
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
var $url_re = "
    ~
    (
      (?:
        https?://                                   # http or https protocol
        |                                           # or
        (?://)?www\d{0,3}[.]                        # www., www1., www2. www999. optionally starting with //
      )
      (?:
        [^\s\[\]\(\)\{\}<>`'\",«»“”‘’\?&/!;:]+      # domain
      )
      (?:                                           # One or more ungreedy:
        [^\s\[\]\(\)\{\}<>`'\"«»“”‘’]+              # Run of non-space, non-brackets, non-punctuation
        |                                           # or
        \([^\s\(\)]*\)                              # balanced parents ()
        |                                           # or
        \[[^\s\[\]]*\]                              # balanced parents []
        |                                           # or
        \{[^\s\{\}]*\}                              # balanced parents {}
      )+
      (?:                                           # One or more greedy:
        [^\s\[\]\(\)\{\}<>`'\",«»“”‘’\.\?&!;:]+     # Run of non-space, non-brackets, non-punctuation
        |                                           # or
        \([^\s\(\)]*\)                              # balanced parents ()
        |                                           # or
        \[[^\s\[\]]*\]                              # balanced parents []
        |                                           # or
        \{[^\s\{\}]*\}                              # balanced parents {}
      )+
    )
    ~xiu
";
...
Изменено: 28.05.2021, 12:14 - Программизд 02
Рейтинг: 0 / 0
09.04.2021, 12:07
    #2928085
Гарыныч
Участник
[игнорирует гостей кроме]
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Распарсирвание URLs
Программизд 02  09.04.2021, 11:49
Допилил распознавание УРЛов

line 1

0 http://sql.ru
1 http://sql.ru/
2 http://sql.ru/page.php

line 2

3 http://sql.ru?a=3&b=4.
4 http://sql.ru?a=3&b=4?

line 2

5 http://sql.ru?a=3&b[1]=4&b[2]=3

line 3

6 (http://sql.ru?a=3&b=4)
7 (http://sql.ru?a=3&b[1]=4&b[2]=3)
8 [[url=http://sql.ru/?a=3&b=4]http://sql.ru?a=3&b=4[/url]]
9 [[url=http://sql.ru/?a=3&b[1]=4&b[2]=3]http://sql.ru?a=3&b[1]=4&b[2]=3[/url]]
10 {http://sql.ru?a=3&b=4}
11 "http://sql.ru?a=3&b=4"

line 4

12 http://sql.ru?a=3&b=7

13 http://sql.ru?a=3&b=(wer)

14 http://sql.ru?a=3&b={wer}

15 http://sql.ru?a=3&b=[wer]

16 http://sql.ru?a=3&b=(wer)a

17 http://sql.ru?a=3&b={wer}a

18 http://sql.ru?a=3&b=[wer]a

19 (http://sql.ru?a=3&b=(wer))

20 {http://sql.ru?a=3&b={wer}}

21 [[url=http://sql.ru/?a=3&b=[wer]]http://sql.ru?a=3&b=[wer][/url]]

22 (http://sql.ru?a=3&b=[wer])

23 https://ru.wikipedia.org/wiki/Vulcan_(ракета-носитель)

24 http://sql.ru/a

25 "http://sql.ru/b"

26 www.sql.ru

27 www.sql.ru

Вот таже самая проверка у жужеля

SQL.RU: 22306340

И вот красавец монстр, который это делает
Код: PHP
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
$re = "~(?xi)
(
  (?:
    https?://                                   # http or https protocol
    |                                           #   or
    (?://)?www\d{0,3}[.]                        # www., www1., www2. www999.
  )
  (?:
  [^\s\[\]()\{\}<>`!;:'\",«»“”‘’\?&/]+          # domain
  )
  (?:                                           # One or more ungreedy:
    [^\s\[\]()\{\}<>`!;:'\",«»“”‘’]+            # Run of non-space, non-()<>
    |                           #   or
    \((?:[^\s()<>]+|(?:\([^\s()<>]+\)))*\)      # balanced parents ()
    |                           #   or
    \[(?:[^\s\[\]<>]+|(?:\[[^\s\[\]<>]+\]))*\]  # balanced parents []
    |                           #   or
    \{(?:[^\s\{\}<>]+|(?:\{[^\s\{\}<>]+\}))*\}  # balanced parents {}
  )+?
  (?:                                           # One or more greeady:
    [^\s\[\]()\{\}<>`!;:'\",«»“”‘’\.\?]+        # Run of non-space, non-()<>
    |                           #   or
    \((?:[^\s()<>]+|(?:\([^\s()<>]+\)))*\)      # balanced parents ()
    |                           #   or
    \[(?:[^\s\[\]<>]+|(?:\[[^\s\[\]<>]+\]))*\]  # balanced parents []
    |                           #   or
    \{(?:[^\s\{\}<>]+|(?:\{[^\s\{\}<>]+\}))*\}  # balanced parents {}
  )+
)~";
шифровка? :))) ( Алекса - Юстасу? )
...
Рейтинг: 0 / 0
14.04.2021, 22:54
    #2941353
Программизд 02
Администратор
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гидроцефалы всех стран соединяйтесь!
Распарсирвание URLs
...
Рейтинг: 0 / 0
14.04.2021, 23:35
    #2941498
Гарыныч
Участник
[игнорирует гостей кроме]
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Распарсирвание URLs
...
Рейтинг: 0 / 0
16.04.2021, 08:49
    #2944805
Husq
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Распарсирвание URLs
Вот скажи нахуя оно тебе?
...
Рейтинг: 0 / 0
16.04.2021, 08:59
    #2944817
Программизд 02
Администратор
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гидроцефалы всех стран соединяйтесь!
Распарсирвание URLs
Чтобы было заепись!
...
Изменено: 16.04.2021, 08:59 - Программизд 02
Рейтинг: 1 / 0
Нравится: Владайка
16.04.2021, 09:51
    #2944951
Husq
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Распарсирвание URLs
Программизд 02  16.04.2021, 08:59
Чтобы было заепись!
Шо заебись
Урл это массы гет

Ну зачем его парсить если он и так из гет массива состоит?
...
Рейтинг: 0 / 0
16.04.2021, 09:55
    #2944956
Программизд 02
Администратор
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гидроцефалы всех стран соединяйтесь!
Распарсирвание URLs
Ты че то походу вообще нихуя не сечешь. Урл нужно находить в тексте и делать его из плейн текста активным кликабельным урлом при этом вычленять его так чтобы не прихватывались лишние символы или наоборот урл не бился где то внутри.
...
Рейтинг: 0 / 0
16.04.2021, 10:31
    #2945027
Husq
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Распарсирвание URLs
Программизд 02  16.04.2021, 09:55
Ты че то походу вообще нихуя не сечешь. Урл нужно находить в тексте и делать его из плейн текста активным кликабельным урлом при этом вычленять его так чтобы не прихватывались лишние символы или наоборот урл не бился где то внутри.
Это ты не сечешь
Я то ещё должен догадаться шо тебе надо?
...
Рейтинг: 0 / 0
16.04.2021, 14:10
    #2945663
Программизд 02
Администратор
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гидроцефалы всех стран соединяйтесь!
Распарсирвание URLs
Husq  16.04.2021, 10:31
Программизд 02  16.04.2021, 09:55
Ты че то походу вообще нихуя не сечешь. Урл нужно находить в тексте и делать его из плейн текста активным кликабельным урлом при этом вычленять его так чтобы не прихватывались лишние символы или наоборот урл не бился где то внутри.
Это ты не сечешь
Я то ещё должен догадаться шо тебе надо?
Т.е. ты не догадался но уже решил что нахуй не нужно. Типичный хуйшкварка:)
...
Рейтинг: 0 / 0
16.04.2021, 16:06
    #2945982
Программизд 02
Администратор
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гидроцефалы всех стран соединяйтесь!
Распарсирвание URLs
Допилил распознавание УРЛов

line 1

0 http://sql.ru
1 http://sql.ru/
2 http://sql.ru/page.php

line 2

3 http://sql.ru?a=3&b=4.
4 http://sql.ru?a=3&b=4?

line 2

5 http://sql.ru?a=3&b[1]=4&b[2]=3

line 3

6 (http://sql.ru?a=3&b=4)
7 (http://sql.ru?a=3&b[1]=4&b[2]=3)
8 [http://sql.ru?a=3&b=4]
9 [http://sql.ru?a=3&b[1]=4&b[2]=3]
10 {http://sql.ru?a=3&b=4}
11 "http://sql.ru?a=3&b=4"

line 4

12 http://sql.ru?a=3&b=7

13 http://sql.ru?a=3&b=(wer)

14 http://sql.ru?a=3&b={wer}

15 http://sql.ru?a=3&b=[wer]

16 http://sql.ru?a=3&b=(wer)a

17 http://sql.ru?a=3&b={wer}a

18 http://sql.ru?a=3&b=[wer]a

19 (http://sql.ru?a=3&b=(wer))

20 {http://sql.ru?a=3&b={wer}}

21 [http://sql.ru?a=3&b=[wer]]

22 (http://sql.ru?a=3&b=[wer])

23 https://ru.wikipedia.org/wiki/Vulcan_(ракета-носитель)

24 http://sql.ru/a

25 "http://sql.ru/b"

26 www.sql.ru

27 www.sql.ru

28 https://ru.wikipedia.org/wiki/Начальник_Генерального_штаба_(Великобритания)

29 https://ru.wikipedia.org/wiki/(1937)#~text=Р,666,

29 https://ru.wikipedia.org/wiki/(1937)#~text=Р,666

564545565666675566666tt5666777551

29 https://ru.wikipedia.org/wiki/Перепись_населения_СССР_(1937)#:~:text=%D0%A0%D1%83%D0%BA%D0%BE%D0%B2%D0%BE%D0%B4%D1%81%D1%82%D0%B2%D1%83%20%D1%81%D1%82%D1%80%D0%B0%D0%BD%D1%8B%20%D1%81%D0%BE%D0%BE%D0%B1%D1%89%D0%B0%D0%BB%D0%BE%D1%81%D1%8C%2C%20%D1%87%D1%82%D0%BE%20%C2%AB%D0%BE%D0%B1%D1%89%D0%B0%D1%8F,%D0%B2%D0%BA%D0%BB%D1%8E%D1%87%D0%B0%D1%8F%20%D0%BA%D0%BE%D0%BD%D1%82%D0%B8%D0%BD%D0%B3%D0%B5%D0%BD%D1%82%D1%8B%20%D0%A0%D0%9A%D0%9A%D0%90%20%D0%B8%20%D0%9D%D0%9A%D0%92%D0%946767
...
Изменено: 27.05.2021, 23:53 - Программизд 02
Рейтинг: 0 / 0
Форумы / Тест / Распарсирвание URLs / 11 сообщений из 11, страница 1 из 1
Целевая тема:
Создать новую тему:
Автор:
Найденые пользователи ...
Разблокировать пользователей ...
Читали тему (1): Анонимы (1)
Игнорируют тему (1): kDn
Читали форум (3): Анонимы (3)
Пользователи онлайн (7): Анонимы (5), Yandex Bot, Bing Bot
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]