SQL Server: сделайте все ВЕРХНИЙ регистр правильным регистром / регистром заголовка

У меня есть таблица, которая была импортирована как ВЕРХНИЙ РЕГИСТР, и я хотел бы превратить ее в правильный регистр. Какой сценарий кто-нибудь из вас использовал для этого?

Просто имейте в виду, что правильное изменение текста в верхнем регистре на текст в собственном регистре может потребовать ручной корректировки в некоторых, ну, в некоторых случаях. Например, с именами: мне не нравятся приложения, в которых мое имя написано с ошибками.

Dave DuPlantis 23.10.2008 19:29

На Земле не будет ни одной функции, которая могла бы правильно передать «ДЭЙВ ДУПЛАНТИС». Данные в верхнем регистре сами по себе являются большой проблемой, потому что в большинстве случаев это просто презентационная проблема.

Tomalak 23.10.2008 20:33

Я знаю Макдональда, который приходит в ярость, когда его называют Макдональдом. И я был бы признателен за правильную оболочку О'Киф, пожалуйста.

DOK 23.10.2008 20:57

@Tomalak: совершенно верно, поэтому вы должны принимать данные в смешанном регистре и сохранять их, когда выбор остается за вами. Полностью согласен с частью WTF ... особенно если вы принимаете "международные" символы.

Dave DuPlantis 23.10.2008 21:04

Это тоже культурный вопрос. По моему опыту, британцы и французы имеют обыкновение писать фамилии в верхнем регистре везде, где у них есть возможность. Я просто не понимаю, это не добавляет ценности.

Tomalak 24.10.2008 11:33

Вероятно, лучше всего переключить принятый ответ.

Brian Webster 27.10.2015 00:07

Мы работаем для банка, который часто предоставляет нам все записи имен в верхнем регистре и ожидает, что мы переведем их в правильный регистр. Вау. DuPont, TaNiqa, IbNSaa'ad ... уф!

Brian Battles 13.10.2017 17:13
ReactJs | Supabase | Добавление данных в базу данных
ReactJs | Supabase | Добавление данных в базу данных
Это и есть ваш редактор таблиц в supabase.👇
Понимание Python и переход к SQL
Понимание Python и переход к SQL
Перед нами лабораторная работа по BloodOath:
107
7
298 890
23
Перейти к ответу Данный вопрос помечен как решенный

Ответы 23

Ответ принят как подходящий

Вот UDF, который поможет ...

create function ProperCase(@Text as varchar(8000))
returns varchar(8000)
as
begin
  declare @Reset bit;
  declare @Ret varchar(8000);
  declare @i int;
  declare @c char(1);

  if @Text is null
    return null;

  select @Reset = 1, @i = 1, @Ret = '';

  while (@i <= len(@Text))
    select @c = substring(@Text, @i, 1),
      @Ret = @Ret + case when @Reset = 1 then UPPER(@c) else LOWER(@c) end,
      @Reset = case when @c like '[a-zA-Z]' then 0 else 1 end,
      @i = @i + 1
  return @Ret
end

Однако вам все равно придется использовать его для обновления ваших данных.

Это взорвется для ввода не на английском языке.

Tomalak 23.10.2008 20:28

Спасибо! работал сначала даже на Azure SQL Server :)

Aaron 21.01.2014 15:03

могу я просто спросить, в какую базу данных и таблицу это входит?

v3nt 27.08.2014 17:22

Пробовал это с SQL Server 2008 и всевозможными акцентами, сработало отлично. На самом деле это зависит от сопоставления

Baptiste 08.12.2016 14:23

Спасибо! Это дает ожидаемые результаты.

Palak Patel 03.05.2017 12:23

как применить эту функцию к моей таблице SQL?

mccull88 30.03.2021 17:59

Эта функция:

  • "Правильный регистр" - все слова "ВЕРХНИЙ РЕГИСТР", разделенные пробелом.
  • оставляет только "строчные слова"
  • работает правильно даже для неанглийских алфавитов
  • является переносимым, так как не использует причудливые функции последних версий SQL-сервера.
  • можно легко изменить, чтобы использовать NCHAR и NVARCHAR для поддержки Unicode, а также любую длину параметра, которую вы сочтете подходящей
  • определение белого пространства можно настроить
CREATE FUNCTION ToProperCase(@string VARCHAR(255)) RETURNS VARCHAR(255)
AS
BEGIN
  DECLARE @i INT           -- index
  DECLARE @l INT           -- input length
  DECLARE @c NCHAR(1)      -- current char
  DECLARE @f INT           -- first letter flag (1/0)
  DECLARE @o VARCHAR(255)  -- output string
  DECLARE @w VARCHAR(10)   -- characters considered as white space

  SET @w = '[' + CHAR(13) + CHAR(10) + CHAR(9) + CHAR(160) + ' ' + ']'
  SET @i = 1
  SET @l = LEN(@string)
  SET @f = 1
  SET @o = ''

  WHILE @i <= @l
  BEGIN
    SET @c = SUBSTRING(@string, @i, 1)
    IF @f = 1 
    BEGIN
     SET @o = @o + @c
     SET @f = 0
    END
    ELSE
    BEGIN
     SET @o = @o + LOWER(@c)
    END

    IF @c LIKE @w SET @f = 1

    SET @i = @i + 1
  END

  RETURN @o
END

Результат:

dbo.ToProperCase('ALL UPPER CASE and    SOME lower ÄÄ ÖÖ ÜÜ ÉÉ ØØ ĈĈ ÆÆ')
-----------------------------------------------------------------
All Upper Case and      Some lower Ää Öö Üü Éé Øø Cc Ææ

Это, безусловно, самое подходящее решение для международного сообщества. Это мой голос. Единственное предположение здесь - это то, что слова разделяет пробел.

Cervo 23.10.2008 20:13

Правда. Автор вопроса не уточнил это, но было бы легко разрешить и другое пустое пространство. Разрывы строк также следует учитывать, но это также зависит от ввода. Спасибо за голосование. :-)

Tomalak 23.10.2008 20:27

Может быть, индекс должен начинаться с 1? Первая подстрока (, 0,1) возвращает <пусто>. Я использую sqlserver2005

jan 19.08.2009 14:25

Вероятно, вам следует включить апостроф в качестве символа пробела по умолчанию, чтобы имя типа O'DONNELL не изменилось на O'donnell.

JustinStolle 23.09.2011 00:15

Спасибо. Похоже, мне понадобится LTRIM () для его возвращаемого значения. Использование 2015.

Irawan Soetomo 21.07.2015 07:00

@IrawanSoetomo Я бы так не подумал, функция не добавляет пробелов к своему выводу.

Tomalak 21.07.2015 13:48

@Tomalak переменная @i должна начинаться с единицы, в противном случае к выходным данным добавляется пробел.

Jakub 30.07.2015 23:11

Я использовал дополнительное условие, чтобы изменить только текущие строки верхнего регистра and Value COLLATE Latin1_General_CS_AS =UPPER(Value) --- stackoverflow.com/questions/3969059/…. Также заметил, что не работает с языком zh-HK

Michael Freidgeim 06.12.2016 09:12

@Michael В прошлый раз я проверил, что в китайском нет верхнего / нижнего регистра. Чего бы вы ожидали?

Tomalak 06.12.2016 10:59

Я ожидал, что строка ввода будет возвращена без изменений, но она вернула "???" Возможно, изменение varchar на Nvarchar исправит это. Но в моей таблице у меня был localeid в отдельном столбце, и я исключил строки zh-HK из запроса. Спасибо за полезную функцию.

Michael Freidgeim 06.12.2016 15:05

Я почти уверен, что использование типа данных Unicode будет иметь значение. Вы также можете использовать NVARCHAR(MAX) для неограниченной длины строки.

Tomalak 06.12.2016 15:08

Я отредактировал функцию на SET @i = 1, чтобы избежать лишнего вызова LTRIM

Michael Freidgeim 20.12.2016 03:21

Почему в ответе CHAR (160) используется в качестве символа «границы слова»?

natenho 22.05.2017 18:00

Поскольку это неразрывный пробел, он выглядит и работает как обычный пробел, но большинство людей не думают об этом, определяя, где разбить строку на слова.

Tomalak 22.05.2017 19:17

Отличная маленькая функция. Не то, чтобы O.P. просил об этом, но если кто-то хочет изменить это так, чтобы нет игнорировал уже строчные слова, а также преобразовывал их, например "tom bombadil" на "Tom Bombadil", просто измените одну строчку - SET @o = @o + @c на SET @o = @o + UPPER(@c). знак равно

NateJ 14.06.2017 21:02

Проблема возникает, если строка с заглавной буквы заключена в квадратные скобки. Есть какие-нибудь быстрые идеи?

Optimaximal 02.05.2018 12:55

@Optimaximal Попробуйте настроить символы, считающиеся пробелами. Это немного сложно, потому что квадратные скобки имеют значение для LIKE, поэтому вам нужно будет их экранировать, если вы хотите сопоставить символы скобок действительный. Измените соответственно предложение LIKE, сравните MSDN.

Tomalak 02.05.2018 13:11

Я пробовал эту функцию на SQL Server 14.0.1000.169, но текст все еще в нижнем регистре. какое-либо решение или проблема совместимости?

Wildan Muhlis 25.05.2018 11:15

@WildanMuhlis Это не проблема совместимости. Функция не использует строчные слова в собственном регистре.

Tomalak 25.05.2018 12:14

Я думаю, вы обнаружите, что следующее более эффективно:

IF OBJECT_ID('dbo.ProperCase') IS NOT NULL
    DROP FUNCTION dbo.ProperCase
GO
CREATE FUNCTION dbo.PROPERCASE (
    @str VARCHAR(8000))
RETURNS VARCHAR(8000)
AS
BEGIN
    SET @str = ' ' + @str
    SET @str = REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE( @str, ' a', ' A'), ' b', ' B'), ' c', ' C'), ' d', ' D'), ' e', ' E'), ' f', ' F'), ' g', ' G'), ' h', ' H'), ' i', ' I'), ' j', ' J'), ' k', ' K'), ' l', ' L'), ' m', ' M'), ' n', ' N'), ' o', ' O'), ' p', ' P'), ' q', ' Q'), ' r', ' R'), ' s', ' S'), ' t', ' T'), ' u', ' U'), ' v', ' V'), ' w', ' W'), ' x', ' X'), ' y', ' Y'), ' z', ' Z')
    RETURN RIGHT(@str, LEN(@str) - 1)
END
GO

Оператор замены может быть вырезан и вставлен непосредственно в запрос SQL. Это очень уродливо, однако, заменив @str на интересующий вас столбец, вы не заплатите цену за неявный курсор, как это было бы с размещенными таким образом udf. Я считаю, что даже использование моего UDF намного эффективнее.

О, и вместо того, чтобы вручную генерировать оператор замены, используйте это:

-- Code Generator for expression
DECLARE @x  INT,
    @c  CHAR(1),
    @sql    VARCHAR(8000)
SET @x = 0
SET @sql = '@str' -- actual variable/column you want to replace
WHILE @x < 26
BEGIN
    SET @c = CHAR(ASCII('a') + @x)
    SET @sql = 'REPLACE(' + @sql + ', '' ' + @c+  ''', '' ' + UPPER(@c) + ''')'
    SET @x = @x + 1
END
PRINT @sql

В любом случае это зависит от количества строк. Я бы хотел, чтобы вы могли просто сделать s / \ b ([a-z]) / uc $ 1 /, но да ладно, мы работаем с имеющимися у нас инструментами.

ПРИМЕЧАНИЕ. Вам придется использовать это так же, как и .... SELECT dbo.ProperCase (LOWER (столбец)), поскольку столбец находится в верхнем регистре. На самом деле он работает довольно быстро на моей таблице из 5000 записей (даже не одной секунды) даже с меньшим.

В ответ на шквал комментариев относительно интернационализации я представляю следующую реализацию, которая обрабатывает каждый символ ascii, полагаясь только на реализацию верхнего и нижнего уровней в SQL Server. Помните, что здесь используются переменные VARCHAR, что означает, что они могут содержать только значения ASCII. Чтобы использовать другие международные алфавиты, вы должны использовать NVARCHAR. Логика будет аналогичной, но вам нужно будет использовать UNICODE и NCHAR вместо ASCII AND CHAR, и оператор замены будет намного более масштабным ....

-- Code Generator for expression
DECLARE @x  INT,
    @c  CHAR(1),
    @sql    VARCHAR(8000),
    @count  INT
SEt @x = 0
SET @count = 0
SET @sql = '@str' -- actual variable you want to replace
WHILE @x < 256
BEGIN
    SET @c = CHAR(@x)
    -- Only generate replacement expression for characters where upper and lowercase differ
    IF @x = ASCII(LOWER(@c)) AND @x != ASCII(UPPER(@c))
    BEGIN
        SET @sql = 'REPLACE(' + @sql + ', '' ' + @c+  ''', '' ' + UPPER(@c) + ''')'
        SET @count = @count + 1
    END
    SET @x = @x + 1
END
PRINT @sql
PRINT 'Total characters substituted: ' + CONVERT(VARCHAR(255), @count)

По сути, предпосылка моего метода заключается в обмене предварительных вычислений на эффективность. Полная реализация ASCII выглядит следующим образом:

IF OBJECT_ID('dbo.ProperCase') IS NOT NULL
    DROP FUNCTION dbo.ProperCase
GO
CREATE FUNCTION dbo.PROPERCASE (
    @str VARCHAR(8000))
RETURNS VARCHAR(8000)
AS
BEGIN
    SET @str = ' ' + @str
SET @str =     REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(@str, ' a', ' A'), ' b', ' B'), ' c', ' C'), ' d', ' D'), ' e', ' E'), ' f', ' F'), ' g', ' G'), ' h', ' H'), ' i', ' I'), ' j', ' J'), ' k', ' K'), ' l', ' L'), ' m', ' M'), ' n', ' N'), ' o', ' O'), ' p', ' P'), ' q', ' Q'), ' r', ' R'), ' s', ' S'), ' t', ' T'), ' u', ' U'), ' v', ' V'), ' w', ' W'), ' x', ' X'), ' y', ' Y'), ' z', ' Z'), ' š', ' Š'), ' œ', ' Œ'), ' ž', ' Ž'), ' à', ' À'), ' á', ' Á'), ' â', ' Â'), ' ã', ' Ã'), ' ä', ' Ä'), ' å', ' Å'), ' æ', ' Æ'), ' ç', ' Ç'), ' è', ' È'), ' é', ' É'), ' ê', ' Ê'), ' ë', ' Ë'), ' ì', ' Ì'), ' í', ' Í'), ' î', ' Î'), ' ï', ' Ï'), ' ð', ' Ð'), ' ñ', ' Ñ'), ' ò', ' Ò'), ' ó', ' Ó'), ' ô', ' Ô'), ' õ', ' Õ'), ' ö', ' Ö'), ' ø', ' Ø'), ' ù', ' Ù'), ' ú', ' Ú'), ' û', ' Û'), ' ü', ' Ü'), ' ý', ' Ý'), ' þ', ' Þ'), ' ÿ', ' Ÿ')
    RETURN RIGHT(@str, LEN(@str) - 1)
END
GO

Да уж. В вашем алфавите всего 26 символов. У меня больше. А как насчет греческого? Или турецкий?

Tomalak 23.10.2008 19:54

Я бы сказал, что другие решения делают то же самое. Но я включил генератор кода. Вы можете просто добавить дополнительные разделы для своего алфавита. Вам нужно будет иметь все как NVARCHAR и использовать NCHAR и UNICODE для преобразования.

Cervo 23.10.2008 20:00

Я думаю, что чем больше у вас персонажей, тем менее эффективен он будет. Но, черт возьми, в некоторых наборах символов каждый символ представляет собой целое слово, поэтому проблема с правильным регистром не применяется ...

Cervo 23.10.2008 20:01

Также я сомневаюсь, что кто-то использует сразу все символы Юникода. Так что, вероятно, просто код генерирует замену для 2 или 3 алфавитов, которые вы используете.

Cervo 23.10.2008 20:03

Это не означает, что вам следует использовать полусырые решения только для английского языка только потому, что вы ожидаете, что данные «вероятно, будут в вашем алфавите». Что касается латинской системы письма, то для (почти) любого символа определен нижний / верхний регистр. Функции преобразования важнее правильности, чем скорости.

Tomalak 23.10.2008 20:05

Я признаю, что Tomalak ваше решение лучше тем, что оно переводит все символы в нижний регистр, кроме первого в слове, которое более переносимо. Другое решение, признанное принятым, также похоже на английский язык. На самом деле мне нужно проголосовать за вашу.

Cervo 23.10.2008 20:10

Но для 99% людей, использующих только свой собственный алфавит, лучше просто использовать подход, основанный на наборах, особенно если у них есть миллионы записей.

Cervo 23.10.2008 20:11

ИМХО, который - опасное заблуждение. В большинстве случаев собственный «взгляд на мир» неполон. В конечном итоге вы создаете решения, которые так же ограничены, как ваш опыт / воображение, и которые взрываются, когда вы сталкиваетесь с делом, о котором вы не думали.

Tomalak 23.10.2008 20:18

Например, я бы никогда не придумал свою собственную реализацию UPPER () или LOWER (), потому что я знаю, что она будет неправильной или неполной. Даже если бы моя реализация была на три порядка быстрее для символов ASCII, чем для SQL Server.

Tomalak 23.10.2008 20:21

Мой новый генератор полностью зависит от реализации UPPER и LOWER в SQL Server, а также от того факта, что существует 255 символов ASCII. Для UNICODE вам нужно использовать функции unicode и верхний предел unicode (возможно, не практично) ... но здесь символы ascii в основном не должны меняться.

Cervo 23.10.2008 20:34

Если они все же изменятся путем применения патча SQL Server, просто перезапустите генератор кода и заново создайте функцию.

Cervo 23.10.2008 20:34

Кстати: ваш второй подход учитывает все 255 символов на одной кодовой странице. Как насчет других кодовых страниц?

Tomalak 23.10.2008 20:36

Я собираюсь поклониться сейчас (некогда). Но я предполагаю, что вы могли бы сгенерировать одно выражение для каждой кодовой страницы и сделать на его основе оператор if. Это сложно, но, вероятно, это просто еще один цикл. Предполагая, что есть способ проверить кодовую страницу, которую использует переменная. Подход такой же

Cervo 23.10.2008 20:42

Просто с большим количеством опций и операторами if, чтобы не делать всю эту замену в одном операторе super replace ... Это становится все более сложным, но основной подход состоит в том, чтобы обменять хранилище (хранилище кода) на скорость, а не делать все это динамически. .

Cervo 23.10.2008 20:44

Вы все равно не сделаете счастливыми Макдональда, ДюПлантиса или О'Кифа.

DOK 23.10.2008 20:59

Опять же, никто не будет, потому что однажды сломанный ("DUPLANTIS") это невозможно исправить.

Tomalak 23.10.2008 21:03

Не слишком ли поздно возвращаться и получать данные без верхнего регистра?

Сторонам фон Неймана, Маккейна, ДеГузмана и Джонсона-Смита вашей клиентской базы может не понравиться результат вашей обработки ...

Кроме того, я предполагаю, что это будет разовое обновление данных? Возможно, будет проще экспортировать, фильтровать / изменять и повторно импортировать исправленные имена в базу данных, а затем вы можете использовать подходы, отличные от SQL, для исправления имен ...

Вся проблема именования возникла как возможные недостатки, где обсуждалась - нет никаких указаний на то, что автор вопроса ссылается на данные, содержащие имена.

Tomalak 24.10.2008 11:35

Ссылка, которую я разместил выше, - отличный вариант, который решает основную проблему: мы никогда не сможем программно учесть все случаи (Смит-Джонс, фон Хаусен, Джон Смит, доктор медицины), по крайней мере, в элегантной манере. Тони вводит понятие символа исключения / прерывания, чтобы иметь дело с этими случаями. В любом случае, основываясь на идее Cervo (верхние все нижние символы предваряются пробелом), вместо этого операторы замены могут быть заключены в одну замену на основе таблицы. На самом деле, в @alpha можно вставить любую комбинацию символов нижний / верхний, и оператор не изменится:

declare @str    nvarchar(8000)
declare @alpha  table (low nchar(1), up nchar(1))


set @str = 'ALL UPPER CASE and    SOME lower ÄÄ ÖÖ ÜÜ ÉÉ ØØ ĈĈ ÆÆ'

-- stage the alpha (needs number table)
insert into @alpha
    -- A-Z / a-z
    select      nchar(n+32),
                nchar(n)
    from        dbo.Number
    where       n between 65 and 90 or
                n between 192 and 223

-- append space at start of str
set @str = lower(' ' + @str)

-- upper all lower case chars preceded by space
select  @str = replace(@str, ' ' + low, ' ' + up) 
from    @Alpha

select @str

Еще одно решение только для US-ASCII.

Tomalak 24.10.2008 11:37

Вы все еще рассматриваете это как ориентированное на США решение, поскольку оно ссылается на символы Unicode. Я знаю, что в исходной публикации использовался набор результатов ASCII от A до Z, но суть решения заключается в том, что это таблица, управляемая парой верхних и нижних символов. Оператор замены просто ссылается на таблицу.

Nathan Skerl 27.10.2008 19:35

изменить: я обновил пример, чтобы использовать ваш образец ввода. Спасибо за любой отзыв

Nathan Skerl 27.10.2008 19:36

Есть ли «неэлегантный» способ работы с наиболее известными вариантами имен без дефисов? Например, «Мак», «О'К», а что нет?

Merritt 17.06.2009 19:29

Если вы можете включить CLR в SQL Server (требуется 2005 или более поздняя версия), вы можете использовать создать функцию CLR, который использует Встроенная функция TextInfo.ToTitleCase, что позволит вам создать способ сделать это с учетом культуры всего в нескольких строках кода.

Я тоже должен голосовать здесь. ИТ безопасны во всем мире и используют чужую библиотеку, которая, вероятно, полна всевозможных проверок. Вы не можете ошибиться здесь :)

Cervo 24.10.2008 03:27

Вот еще один вариант, который я нашел на форумах SQLTeam.com @ http://www.sqlteam.com/forums/topic.asp?TOPIC_ID=47718

create FUNCTION PROPERCASE
(
--The string to be converted to proper case
@input varchar(8000)
)
--This function returns the proper case string of varchar type
RETURNS varchar(8000)
AS
BEGIN
IF @input IS NULL
BEGIN
--Just return NULL if input string is NULL
RETURN NULL
END

--Character variable declarations
DECLARE @output varchar(8000)
--Integer variable declarations
DECLARE @ctr int, @len int, @found_at int
--Constant declarations
DECLARE @LOWER_CASE_a int, @LOWER_CASE_z int, @Delimiter char(3), @UPPER_CASE_A int, @UPPER_CASE_Z int

--Variable/Constant initializations
SET @ctr = 1
SET @len = LEN(@input)
SET @output = ''
SET @LOWER_CASE_a = 97
SET @LOWER_CASE_z = 122
SET @Delimiter = ' ,-'
SET @UPPER_CASE_A = 65
SET @UPPER_CASE_Z = 90

WHILE @ctr <= @len
BEGIN
--This loop will take care of reccuring white spaces
WHILE CHARINDEX(SUBSTRING(@input,@ctr,1), @Delimiter) > 0
BEGIN
SET @output = @output + SUBSTRING(@input,@ctr,1)
SET @ctr = @ctr + 1
END

IF ASCII(SUBSTRING(@input,@ctr,1)) BETWEEN @LOWER_CASE_a AND @LOWER_CASE_z
BEGIN
--Converting the first character to upper case
SET @output = @output + UPPER(SUBSTRING(@input,@ctr,1))
END
ELSE
BEGIN
SET @output = @output + SUBSTRING(@input,@ctr,1)
END

SET @ctr = @ctr + 1

WHILE CHARINDEX(SUBSTRING(@input,@ctr,1), @Delimiter) = 0 AND (@ctr <= @len)
BEGIN
IF ASCII(SUBSTRING(@input,@ctr,1)) BETWEEN @UPPER_CASE_A AND @UPPER_CASE_Z
BEGIN
SET @output = @output + LOWER(SUBSTRING(@input,@ctr,1))
END
ELSE
BEGIN
SET @output = @output + SUBSTRING(@input,@ctr,1)
END
SET @ctr = @ctr + 1
END

END
RETURN @output
END



GO
SET QUOTED_IDENTIFIER OFF
GO
SET ANSI_NULLS ON
GO

Вот версия, в которой вместо цикла используется таблица последовательности или чисел. Вы можете изменить предложение WHERE, чтобы оно соответствовало вашим личным правилам, когда преобразовывать символ в верхний регистр. Я только что включил простой набор, который будет прописывать любую букву, после которой идет не буква, за исключением апострофов. Однако это означает, что 123apple будет иметь совпадение с буквой «а», потому что «3» не является буквой. Если вам нужен только пробел (пробел, табуляция, возврат каретки, перевод строки), вы можете заменить шаблон '[^a-z]' на '[' + Char(32) + Char(9) + Char(13) + Char(10) + ']'.


CREATE FUNCTION String.InitCap( @string nvarchar(4000) ) RETURNS nvarchar(4000) AS
BEGIN

-- 1. Convert all letters to lower case
    DECLARE @InitCap nvarchar(4000); SET @InitCap = Lower(@string);

-- 2. Using a Sequence, replace the letters that should be upper case with their upper case version
    SELECT @InitCap = Stuff( @InitCap, n, 1, Upper( SubString( @InitCap, n, 1 ) ) )
    FROM (
        SELECT (1 + n1.n + n10.n + n100.n + n1000.n) AS n
        FROM       (SELECT 0 AS n UNION SELECT    1 UNION SELECT    2 UNION SELECT    3 UNION SELECT    4 UNION SELECT    5 UNION SELECT    6 UNION SELECT    7 UNION SELECT    8 UNION SELECT    9) AS    n1
        CROSS JOIN (SELECT 0 AS n UNION SELECT   10 UNION SELECT   20 UNION SELECT   30 UNION SELECT   40 UNION SELECT   50 UNION SELECT   60 UNION SELECT   70 UNION SELECT   80 UNION SELECT   90) AS   n10
        CROSS JOIN (SELECT 0 AS n UNION SELECT  100 UNION SELECT  200 UNION SELECT  300 UNION SELECT  400 UNION SELECT  500 UNION SELECT  600 UNION SELECT  700 UNION SELECT  800 UNION SELECT  900) AS  n100
        CROSS JOIN (SELECT 0 AS n UNION SELECT 1000 UNION SELECT 2000 UNION SELECT 3000)                                                                                                             AS n1000
        ) AS Sequence
    WHERE 
        n BETWEEN 1 AND Len( @InitCap )
    AND SubString( @InitCap, n, 1 ) LIKE '[a-z]'                 /* this character is a letter */
    AND (
        n = 1                                                    /* this character is the first `character` */
        OR SubString( @InitCap, n-1, 1 ) LIKE '[^a-z]'           /* the previous character is NOT a letter */
        )
    AND (
        n < 3                                                    /* only test the 3rd or greater characters for this exception */
        OR SubString( @InitCap, n-2, 3 ) NOT LIKE '[a-z]''[a-z]' /* exception: The pattern <letter>'<letter> should not capatolize the letter following the apostrophy */
        )

-- 3. Return the modified version of the input
    RETURN @InitCap

END

Было бы разумно продолжить поиск исключений, чтобы позаботиться о фон Неймане, Маккейне, ДеГузмане и Джонсон-Смит.

UPDATE titles
  SET title =
      UPPER(LEFT(title, 1)) +
        LOWER(RIGHT(title, LEN(title) - 1))

http://sqlmag.com/t-sql/how-title-case-column-value

К вашему сведению, это работает для значений из одного слова, но не для значений из нескольких слов. Таким образом, "СЕВЕРНАЯ КАРОЛИНА" становится "Северной Каролиной" вместо исключительной "Северной Каролины".

molaro 02.05.2014 17:56

+1 как простое решение, состоящее из одного слова, которое хорошо сработало для меня. Единственное - вы можете получить ошибку, если title пуст.

Serg 08.08.2014 11:59

@molaro разделяет пространство и работает с каждым словом индивидуально. Хорошее решение, но с небольшим ограничением по длине возможностей. Будущие зрители могут захотеть разделить ваше предложение на терминатор и первый регистр первого слова в предложении.

GoldBishop 01.05.2017 18:56

Добавьте WHERE title IS NOT NULL в конец, чтобы решить проблему @Serg.

Paul 11.10.2017 16:30

@Serg Я отредактировал код, чтобы он не запускался с ошибками на строках нулевой длины, используя SUBSTRING вместо RIGHT

robotik 03.07.2020 12:30

Я знаю, что это поздний пост в этой теме, но его стоит посмотреть. Эта функция у меня работает всегда. Так что подумал о том, чтобы поделиться им.

CREATE FUNCTION [dbo].[fnConvert_TitleCase] (@InputString VARCHAR(4000) )
RETURNS VARCHAR(4000)
AS
BEGIN
DECLARE @Index INT
DECLARE @Char CHAR(1)
DECLARE @OutputString VARCHAR(255)

SET @OutputString = LOWER(@InputString)
SET @Index = 2
SET @OutputString = STUFF(@OutputString, 1, 1,UPPER(SUBSTRING(@InputString,1,1)))

WHILE @Index <= LEN(@InputString)
BEGIN
    SET @Char = SUBSTRING(@InputString, @Index, 1)
    IF @Char IN (' ', ';', ':', '!', '?', ',', '.', '_', '-', '/', '&','''','(')
    IF @Index + 1 <= LEN(@InputString)
BEGIN
    IF @Char != ''''
    OR
    UPPER(SUBSTRING(@InputString, @Index + 1, 1)) != 'S'
    SET @OutputString =
    STUFF(@OutputString, @Index + 1, 1,UPPER(SUBSTRING(@InputString, @Index + 1, 1)))
END
    SET @Index = @Index + 1
END

RETURN ISNULL(@OutputString,'')
END

Тестовые звонки:

select dbo.fnConvert_TitleCase(Upper('ÄÄ ÖÖ ÜÜ ÉÉ ØØ ĈĈ ÆÆ')) as test
select dbo.fnConvert_TitleCase(upper('Whatever the mind of man can conceive and believe, it can achieve. – Napoleon hill')) as test

Полученные результаты:

Можете ли вы описать, почему она лучше, чем функция stackoverflow.com/questions/230138/… Томалака ToProperCase?

Michael Freidgeim 06.12.2016 15:12

Основываясь на примерах, приведенных с этим ответом, и Томалаком вместе с описанием Томалака того, что он делает («не трогает строчные слова»), этот ответ лучше. Я не проверял Томалака, но этот ответ вводит надлежащий регистр (насколько мои потребности могут проверить). «Правильный регистр - это любой текст, в котором каждая из первых букв каждого слова написана с заглавной буквы». - computerhope.com/jargon/p/proper-case.htm

Morvael 10.04.2019 12:41

Если вы в SSIS импортируете данные со смешанным регистром и вам нужно выполнить поиск в столбце с правильным регистром, вы заметите, что поиск не выполняется, если источник смешанный, а источник поиска правильный. Вы также заметите, что вы не можете использовать правую и левую функции в SSIS для SQL Server 2008r2 для производных столбцов. Вот решение, которое мне подходит:

UPPER(substring(input_column_name,1,1)) + LOWER(substring(input_column_name, 2, len(input_column_name)-1))

Я немного опоздал в игре, но я считаю, что это более функционально и работает с любым языком, включая русский, немецкий, тайский, вьетнамский и т. д. Он сделает все, что угодно, после 'или - или'. или (или) или пробел (очевидно :).

CREATE FUNCTION [dbo].[fnToProperCase]( @name nvarchar(500) )
RETURNS nvarchar(500)
AS
BEGIN
declare @pos    int = 1
      , @pos2   int

if (@name <> '')--or @name = lower(@name) collate SQL_Latin1_General_CP1_CS_AS or @name = upper(@name) collate SQL_Latin1_General_CP1_CS_AS)
begin
    set @name = lower(rtrim(@name))
    while (1 = 1)
    begin
        set @name = stuff(@name, @pos, 1, upper(substring(@name, @pos, 1)))
        set @pos2 = patindex('%[- ''.)(]%', substring(@name, @pos, 500))
        set @pos += @pos2
        if (isnull(@pos2, 0) = 0 or @pos > len(@name))
            break
    end
end

return @name
END
GO

Это хорошо работает, за исключением того, что «дом Джека» становится «Домом Джека».

Damien 28.06.2019 07:38

Дом Джека - это не имя человека. О'Брайан, О'Коннелл - это имена :) Если вы не имеете дело исключительно с именами людей, изменение необходимо.

Alansoft 06.03.2020 16:45

Однако дом Джека вполне мог быть названием бизнеса.

John Luther Barnhart 13.11.2020 22:33

Я знаю, что дьявол кроется в деталях (особенно в том, что касается личных данных людей), и что было бы очень хорошо иметь имена, написанные правильно с заглавной буквы, но из-за вышеупомянутого вида хлопот среди нас прагматичные, внимательные ко времени используют следующие :

SELECT UPPER('Put YoUR O'So oddLy casED McWeird-nAme von rightHERE here')

По моему опыту, люди прекрасно видят ИХ ИМЯ ... даже когда речь идет о середине предложения.

Обратитесь к: русские использовали карандаш!

Отказ от вопроса бесполезен. Этот «ответ» является комментарием НАИЛУЧШЕГО.

Phil 29.05.2019 23:10

Только что узнал про InitCap().

Вот пример кода:

SELECT ID
      ,InitCap(LastName ||', '|| FirstName ||' '|| Nvl(MiddleName,'')) AS RecipientName
FROM SomeTable

OP указал Sql Server, «InitCap ()» - это вещь Oracle.

mxmissile 05.10.2018 16:58

Это работало в SSMS:

Select Jobtitle,
concat(Upper(LEFT(jobtitle,1)), SUBSTRING(jobtitle,2,LEN(jobtitle))) as Propercase
From [HumanResources].[Employee]

Заимствовал и улучшил ответ @Richard Sayakanit. Это обрабатывает несколько слов. Как и его ответ, здесь не используются какие-либо UDF, только встроенные функции (STRING_SPLIT и STRING_AGG), и это довольно быстро. STRING_AGG требует SQL Server 2017, но вы всегда можете использовать трюк STUFF/XML. Не обрабатывает каждое исключение, но может отлично работать для многих требований.

SELECT StateName = 'North Carolina' 
INTO #States
UNION ALL
SELECT 'Texas'


;WITH cteData AS 
(
    SELECT 
        UPPER(LEFT(value, 1)) +
            LOWER(RIGHT(value, LEN(value) - 1)) value, op.StateName
    FROM   #States op
    CROSS APPLY STRING_SPLIT(op.StateName, ' ') AS ss
)
SELECT 
    STRING_AGG(value, ' ')
FROM cteData c 
GROUP BY StateName

Если вы знаете, что все данные - это всего лишь одно слово, вот решение. Сначала обновите столбец до более низкого уровня, а затем запустите следующее

    update tableName set columnName = 
    upper(SUBSTRING(columnName, 1, 1)) + substring(columnName, 2, len(columnName)) from tableName

Небольшая модификация ответа @Galwegian - который превращается, например, в St Elizabeth's в St Elizabeth'S.

Эта модификация сохраняет апостроф-s в нижнем регистре, где s стоит в конце предоставленной строки или s следует за пробелом (и только в этих обстоятельствах).

create function properCase(@text as varchar(8000))
returns varchar(8000)
as
begin
    declare @reset int;
    declare @ret varchar(8000);
    declare @i int;
    declare @c char(1);
    declare @d char(1);

    if @text is null
    return null;

    select @reset = 1, @i = 1, @ret = '';

    while (@i <= len(@text))
    select
        @c = substring(@text, @i, 1),
        @d = substring(@text, @i+1, 1),
        @ret = @ret + case when @reset = 1 or (@reset=-1 and @c!='s') or (@reset=-1 and @c='s' and @d!=' ') then upper(@c) else lower(@c) end,
        @reset = case when @c like '[a-za-z]' then 0 when @c='''' then -1 else 1 end,
        @i = @i + 1
    return @ret
end

Получается:

  • st elizabeth's в St Elizabeth's
  • o'keefe в O'Keefe
  • o'sullivan в O'Sullivan

Комментарии других о том, что для ввода, отличного от английского, предпочтительнее использовать другие решения, остаются в силе.

Недавно пришлось заняться этим и придумал следующее после того, как ничто не поразило все, что я хотел. Это сделает все предложение, случаи для специальной обработки слов. У нас также были проблемы с односимвольными «словами», которые обрабатываются многими более простыми методами, но не более сложными. Переменная с одним возвратом, без циклов и курсоров.

CREATE FUNCTION ProperCase(@Text AS NVARCHAR(MAX))
RETURNS NVARCHAR(MAX)
AS BEGIN

    DECLARE @return NVARCHAR(MAX)

    SELECT @return = COALESCE(@return + ' ', '') + Word FROM (
         SELECT CASE
            WHEN LOWER(value) = 'llc' THEN UPPER(value)
            WHEN LOWER(value) = 'lp' THEN UPPER(value) --Add as many new special cases as needed
            ELSE
               CASE WHEN LEN(value) = 1
               THEN UPPER(value)
               ELSE UPPER(LEFT(value, 1)) + (LOWER(RIGHT(value, LEN(value) - 1)))
              END
            END AS Word
         FROM STRING_SPLIT(@Text, ' ')
     ) tmp

     RETURN @return
END

Скопируйте и вставьте свои данные в MS Word и используйте встроенное преобразование текста, чтобы «использовать заглавные буквы в каждом слове». Сравните с вашими исходными данными, чтобы устранить исключения. Не вижу способа вручную обойти исключения типа "MacDonald" и "IBM", но именно так я сделал FWIW.

На Server Server 2016 и новее вы можете использовать STRING_SPLIT


with t as (
    select 'GOOFYEAR Tire and Rubber Company' as n
    union all
    select 'THE HAPPY BEAR' as n
    union all
    select 'MONK HOUSE SALES' as n
    union all
    select 'FORUM COMMUNICATIONS' as n
)
select
    n,
    (
        select ' ' + (
            upper(left(value, 1))
            + lower(substring(value, 2, 999))
        )
        from (
            select value
            from string_split(t.n, ' ')
        ) as sq
        for xml path ('')
    ) as title_cased
from t

Пример

К сожалению, я предлагаю еще одну функцию. Этот кажется быстрее, чем большинство, но использует только первую букву слов, разделенных пробелами. Я проверил, что ввод не равен нулю, и что он работает, если у вас есть несколько пробелов где-то в середине строки. Я перекрестно применяю функцию длины, поэтому мне не нужно вызывать ее дважды. Я бы подумал, что SQL Server кэширует это значение. Пусть покупатель будет бдителен.

CREATE OR ALTER FUNCTION dbo.ProperCase(@value varchar(MAX)) RETURNS varchar(MAX) AS  
 BEGIN
 
     RETURN (SELECT STRING_AGG(CASE lv WHEN 0 THEN '' WHEN 1 THEN UPPER(value) 
      ELSE UPPER(LEFT(value,1)) + LOWER(RIGHT(value,lv-1)) END,' ')  
     FROM STRING_SPLIT(TRIM(@value),' ') AS ss 
      CROSS APPLY (SELECT LEN(VALUE) lv) AS reuse 
     WHERE @value IS NOT NULL)

 END

Другие вопросы по теме