Захват текста ссылками

10 декабря, 20:09

Работал сегодня над интересной задачей (в рамках проекта zzweb.ru) – захват близлежащих слов ссылками.

Например, в середине предложения встречается какая-то ссылка. По умолчанию zzweb оформит ее как подчеркнутое слово “ссылка”, что универсально, но не всегда красиво. Гораздо интереснее взять часть предложения, внутри которого расположена ссылка, и сделать его активным.

Но какие слова выбрать – справа или слева от ссылки? Сколько слов взять? Какие знаки препинания считать ограничивающими смысловую связь, а какие – протягивающими его? Как быть, если вокруг одного слова расположились сразу две ссылки? А если несколько ссылок между словами? А вдруг это не предложение, какой-то список? Что вообще считать предложением и на каких текстах проверять все это?

Ну и самый интересный вопрос – как весь этот зоопарк втиснуть в одно-единственное регулярное выражение? :)

Сегодня у меня что-то получилось, все придуманные тесты пройдены. Вроде бы даже ничего так вышло, приятно. Теперь вот буду наблюдать за поведением своей логики на страницах пользователей zzweb. Практика показывает, люди невзначай такие варианты подбрасывают, что нарочно фиг придумаешь…

btw, следить за развитием zzweb.ru удобно тут…

Хотите что-нибудь сказать?..

Ваше имя

Ваш комментарий: